Кодирование текстовой
информации
Информация, выраженная с помощью естественных и формальных языков в письменной форме, называется текстовой информацией.
Начиная с конца 60-х годов прошлого века, компьютеры все больше
стали использоваться
для обработки текстовой
информации.
Историческая справка
Криптография - это тайнопись, система изменения письма с целью сделать текст непонятным для непосвященных лиц
Азбука Морзе или неравномерный телеграфный код, в котором каждая буква или знак представлены своей комбинацией коротких элементарных посылок электрического тока (точек) и элементарных посылок утроенной продолжительности (тире)
Сурдожесты –
язык жестов, используемый людьми с нарушениями слуха
Кодирование текстовой информации -
преобразование входной информации в форму, воспринимаемую компьютером, т.е. данные (двоичный код).
Декодирование текстовой информации -
преобразование данных из двоичного кода в форму, понятную человеку.
256 =2 I = 2 8 =2 I = I= 8 битов = 1 байт " width="640"
Для кодирования одного символа требуется один байт информации
Учитывая, что каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов.
N=2 I N – мощность алфавита
2 8 =256 I – информационный вес
N=2 I = 256 =2 I = 2 8 =2 I = I= 8 битов = 1 байт
Кодирование и декодирование текстовой информации
Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер - по их коду.
Процессор
01000001
Оперативная память
01000001
А
А
Таблица кодов
т аблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды)
Таблица кодировки ASCII является стандартной, и ее понимают абсолютно все программы, работающие с текстами.
Кодовая таблица ASCII
A merican S tandard C ode f or I nformation I nterchange
коды от 0 до 31
коды от 128 до 255
коды от 32 до 127
функциональные
клавиши
национальный алфавит
буквы английского алфавита,
знаки математических операций и т.д.
Кодировки русского алфавита
В настоящее время широкое распространение получил Новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и потому с его помощью можно закодировать не 256 символов, а N = 2 16 = 65 536 различных символов. Такого количества символов достаточно, чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты.
Таблица кодировки Unicode
Стандарт кодирования Unicode отводит на каждый символ 2 байта, что позволяет закодировать многие алфавиты в одной таблице.
N=2 I =2 16 =65 536
В настоящее время существует
5 кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac , ISO ), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.
Таблицы кодировки русскоязычных символов код обмена информации 8-битный
КОИ8-Р
CP1251
CP866
Mac
ISO
Символ
Windows
А
MS-DOS
В
192
128
КОИ-8
194
М
225
130
Mac
Э
204
ISO
128
247
221
я
140
130
176
Unicode
157
237
255
1040
178
140
252
239
1042
241
188
157
205
1052
223
1069
239
1103
Декодировать текст с помощью кодовой таблицы ASCII :
99 111 109 112 117 116 101 114
computer
Работа в текстовом редакторе MS Word
Запустите текстовый редактор
MS Word . Удерживая клавишу « ALT », наберите коды на дополнительной цифровой клавиатуре:
152 170 174 171 160
Школа
Домашнее задание
п. 3.1.
Произвести кодирование стихотворения из 4-х строк (до 100 символов)
Контактная информация
Автор-разработчик:
Шорохова Екатерина Николаевна,
учитель информатики
МОБУ «Промышленновская ООШ № 3»
Наш адрес:
652380, Кемеровская область, Промышленновский район, пгт.Промышленная, пер.Мичурина, д. 3
e - mail : promschool 3 mich @ yandex . ru