Двоичное кодирование текстовой информации
Двоичное кодирование текстовой информации
- Компьютеры не с самого рождения могли обрабатывать символьную информацию. Лишь с конца 60-х годов они стали использоваться для обработки текстов и в настоящее время большинство пользователей ПК занимаются вводом, редактированием и форматированием текстовой информации.
- Традиционно для кодирования одного символа используется 1 байт информации.
- При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение символа преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает один байт.
- В процессе вывода символа на экран компьютера производится обратный процесс - декодирование, то есть преобразование кода символа в его изображение.
- Важно, что присвоение символу конкретного кода - это вопрос соглашения, которое фиксируется в кодовой таблице.
Стандартная часть таблицы кодов ASCII
- Первые 32 кода отданы производителям аппаратных средств и называются они управляющие, т.к. эти коды управляют выводом данных. Им не соответствуют никакие символы.
- Коды с 32 по 127 соответствуют символам английского алфавита, знакам препинания, цифрам, арифметическим действиям и некоторым вспомогательным символам.
Коды национального (русского) алфавита
- Коды расширенной части таблицы ASCII отданы под символы национальных алфавитов, символы псевдографики и научные символы.
Альтернативные системы кодирования кириллицы
1. Система кодирования КОИ-7 (код обмена информацией, семизначный), действовавшая в СССР. Была вскоре вытеснена американским: кодом ASCII во вторую, расширенную часть системы кодирования с кодами от 128 по 255.
2. Кодировка Windows-1251. Была введена извне компанией Мiсrosоft. Так как программный продукт этой компании - операционная система Windows глубоко закрепилась и широко распространилась, то кодировка Windows-1251 получила широкое применение на компьютерах, работающих под управлением именно этой операционной системы.
3. Кодировка КОИ-8 широко распространена на территории России и в российском секторе Интернета.
4. Кодировка ISO (lntemational Standard Organization – Международный институт стандартизации) - содержит символы русского алфавита, но на практике используется редко.
5. Кодировка ГОСТ - альтернативная. Действует на компьютерах в операционных системах MS-DOS.
6. Система UNICODE. Для представления каждого символа в этом стандарте используются два байта: один байт для кодирования символа, другой для кодирования признака. Двухбайтовое описание кодов символов позволяет закодировать очень большое число символов из различных письменностей. Так, в документах Unicode могут соседствовать русские, латинские, греческие буквы, китайские иероглифы и математические символы.
Закрепление изученного
- № 1. Закодируйте с помощью таблицы ASCII слова: А) Excel; Б) Access; В) Windows; Г) ИНФОРМАЦИЯ.
- № 2. Буква «i» в таблице кодов имеет код 105. Не пользуясь таблицей, расшифруйте следующую последовательность кодов: 102, 105, 108, 101.
- № 3. Десятичный код буквы «е» в таблице ASCII равен 101. Не пользуясь таблицей, составьте последовательность кодов, соответствующих слову help.
- № 4. Десятичный код буквы «i» в таблице ASCII равен 105. Не пользуясь таблицей, составьте последовательность кодов, соответствующих слову link.
- № 5. Декодируйте следующие тексты, заданные десятичным кодом:
- А) 192 235 227 238 240 232 242 236; Б) 193 235 238 234 45 241 245 229 236 224; В) 115 l1l 102 116 119 97 114 101.
- № 6. Во сколько раз увеличится информационный объем страницы текста при его преобразовании из кодировки Windows 1251 (таблица кодировки содержит 256 символов) в кодировку Unicode (таблица кодировки содержит 65536 символов)?
- № 7. Каков информационный объем текста, содержащего слово ПРОГРАММИРОВАНИЕ: А) в 16-битной кодировке; Б) в 8-битной кодировке.
- № 8 . Текст занимает ¼ Кбайта. Какое количество символов он содержит?
- № 9 . Текст занимает полных 6 страниц. На каждой странице размещается 30 строк по 80 символов. Определить объем оперативной памяти, который займет этот текст.
- № 10. Свободный объем оперативной памяти компьютера 320 Кбайт. Сколько страниц книги поместится в ней, если на странице: А) 32 строки по 32 символа; ) 64 строки по 64 символа; В) 16 строк по 32 символа.
- № 11. Текст занимает 20 секторов на двусторонней дискете объемом 360 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст?
Домашнее задание
- §2.10. Двоичное кодирование текстовой информации
- Стр.111 практические задания
- № 2.29, 2.30, 2.31