ПРЕДСТАВЛЕНИЕ ТЕКСТА В КОМПЬЮТЕРЕ
ТЕКСТ В КОМПЬЮТЕРЕ
ANSI - Американский национальный институт стандартизации
ISO - Международная организация стандартизации
ASCII
ASCII - американский стандартный код для обмена информацией
КОДИРОВКИ В КОМПЬЮТЕРЕ
СР-866
Windows-1251
КОИ-8 – код обмена информацией
Windows-1251
КОИ-8
ТЕКСТ В КОМПЬЮТЕРЕ
Пример . Вот так будет выглядеть десятичный код слова «Диск» в разных кодировках:
- КОИ - 8 228 201 211 203
- Windows-1251 - 196 232 241 234
- СР-866 - 132 168 225 170
UNICODE
Unicode :
- Все языки (национальные, мертвые, вымышленные)
- Цифры, знаки препинания, математические символы
1 символ весит 32 бита
Укороченная версия 1 символ – 16 бит
В UNIX-системах: UTF-8
ТЕКСТ В КОМПЬЮТЕРЕ
Информационный объем информации - количество бит, байт или производных единиц (килобайт, мегабайт и т, д.), необходимых для записи этого текста путем заранее оговоренного способа двоичного кодирования.
Задание. Оцените в байтах объем текстовой информации в «Современном словаре иностранных слов» из 740 страниц, если на одной странице размещается в среднем 60 строк по 80 символов (включая пробелы).
Решение .
Будем считать, что при записи используется кодировка «один символ - один байт»».
Количество символов во всем словаре равно
80 • 60 •740 = 3 552 000.
Следовательно, объем в байтах равен 3 552 000 байт = 3 468,75 кбайт = 3,39 Мбайт.

"Кодирование текстовой информации" (1.74 MB)

