Двоичное кодирование символов. Мини-исследование.
Цель работы:
- выявить взаимосвязь между длиной двоичного кода и количеством символов, которые возможно закодировать этим кодом.
Ход работы:
Компьютер различает символы по их коду. Поэтому, чтобы закодировать сообщение записанное, например, на русском языке, нужно каждой букве русского алфавита поставить в соответствие не повторяющийся двоичный код.
При этом нужно помнить: в тексте мы используем не только заглавные, но и строчные буквы, десятичные цифры, всевозможные знаки препинания и для разделения слов – пробел. Следовательно, нам нужно предусмотреть уникальный двоичный код для каждого из этих символов.
Выясним, какова зависимость между мощностью алфавита (количеством используемых символов) и длиной двоичного кода, который необходим для кодирования одного символа. Будем использовать равномерное кодирование, т. е. все коды имеют одинаковую длину.
А – 0 Б – 1
Чтобы закодировать 1-2 буквы, достаточно 1 двоичного знака. Но для кодировки 3-й буквы нам потребуется увеличить длину кода. | А – 00 Б – 01 В – 10 Г – 11
Чтобы закодировать 3-4 буквы, потребуется 2 двоичных знака. Для кодировки 5-й буквы нам снова нужно увеличивать длину кода. | А – 000 Б – 001 В – 010 Г – 011 Д – 100 Е – 101 Ё – 110 Ж – 111
Чтобы закодировать 5-8 букв, длина кода составит 3 двоичных знака. | А – 0000 Б – 0001 В – 0010 Г – 0011 Д – 0100 Е – 0101 Ё – 0110 Ж – 0111 З – 1000 И – 1001 Й – 1010 К – 1011 Л – 1100 М – 1101 Н – 1110 О – 1111
Чтобы закодировать 9-16 букв, длина кода составит 4 двоичных знака. И так далее… |
Один двоичный знак принято называть 1-м битом (от английского словосочетания binary digit - двоичная цифра). Получим:
Количество символов алфавита, N | Длина двоичного кода, i |
2 | 1 бит |
4 | 2 бита |
8 | 3 бита |
16 | 4 бита |
|
|
|
|
|
|
|
|
|
|
|
|
Выполните задания:
№1. Заполните пустые строки таблицы.
№2. Сколько бит на одну букву потребуется, чтобы можно было закодировать русский алфавит (33 буквы)?
№3. В чем состоит зависимость между количеством кодируемых символов и длиной двоичного кода? Попробуйте сформулировать её.
№4. Выпишите формулу зависимости со страницы 41 учебника (внизу страницы).
Используя формулу, проверьте правильность выполнения задания №1.
N=21=2
N=22=2*2=4
N=23=2*2*2=8
N=24=2*2*2*2=16
…
№6. Дополнительное задание: В некотором сообщении используются заглавные и строчные буквы латинского алфавита, точка, запятая и пробел. Какое количество бит потребуется для кодирования одного символа этого сообщения? Для справки: в латинском алфавите 26 букв.