Меню
Видеоучебник
Видеоучебник  /  Информатика  /  10 класс  /  Информатика 10 класс (ФГОС)  /  Измерение информации. Алфавитный подход

Измерение информации. Алфавитный подход

Урок 4. Информатика 10 класс (ФГОС)

Процесс познания окружающего мира приводит к накоплению информации в форме знаний. Как же узнать, много её получено или нет? Важно понимать, хватит ли места на носителе, чтобы сохранить нужную информацию, и как много времени необходимо для того, чтобы передать её по каналу связи. На этом уроке учащиеся рассмотрят алфавитный, или объёмный, подход к измерению информации, узнают, есть ли связь между алфавитным подходом к измерению информации и содержанием информации, а также выяснят, в каких единицах измеряется объем письменного или печатного текста.

Конспект урока "Измерение информации. Алфавитный подход"

Вопросы занятия:

·                   алфавитный (объёмный) подход к измерению информации;

·                   связь между алфавитным подходом к измерению информации и содержанием информации;

·                   единицы измерения объёма письменного или печатного текста.

Процесс познания окружающего мира приводит к накоплению информации в форме знаний. Как же узнать, много получено информации или нет?

Из прошлых уроков вы знаете, что информацию можно собирать, обрабатывать, хранить, и передавать.

Но тогда очень важно понимать хватит ли места на носителе, чтобы сохранить нужную информацию. Или сколько времени нужно, чтобы передать информацию по каналу связи.

Как вы понимаете, нам просто необходимо научиться измерять информацию.

В компьютерных (цифровых) системах хранения и передачи информации применяется алфавитный подход к измерению информации. Здесь используется двоичный способ кодирования информации и важен только размер или объём хранимого и передаваемого кода. Именно поэтому алфавитный подход также называют объёмным.

Мы уже говорили о том, что разрядность двоичного кода i и количество возможных кодовых комбинаций или мощность алфавита N связаны соотношением:

Например,

Рассмотрим систему кодирования английского алфавита.

Английский алфавит состоит из 26 букв. Добавляем сюда же пробел, точку, запятую, вопросительный и восклицательный знаки, тире, то есть ещё 6 символов. Тогда расширенный алфавит состоит из 32 символов.

Так как 32 = 25 значит, все символы можно закодировать пятиразрядными двоичными кодами от пяти нулей до пяти единиц.

Мы уже встречали такой пятиразрядный код, когда изучали телеграфные аппараты, появившиеся в девятнадцатом веке. Помните код Бодо?

В двоичном коде каждая двоичная цифра несёт одну единицу информации, которую называют один бит. Именно бит является единицей измерения информации.

Длина двоичного кода, с помощью которого кодируется символ алфавита, называется информационным весом символа. Так, например, информационный вес символа расширенного английского алфавита равен пяти битам.

Информационный объем текста складывается из информационных весов всех символов, составляющих текст. Например, английский текст из тысячи символов в телеграфном сообщении будет иметь информационный объем пять тысяч бит.

Теперь рассмотрим систему кодирования русского языка. Русский алфавит состоит из 33 букв. Добавляем к нему те же 6 дополнительных символов, что и для английского алфавита, получаем набор из 39 символов.

Понятно, что пятиразрядного кода нам уже не хватает. Попробуем шестиразрядный код.

Так как 26 = 64, остаются свободные 25 символов, которые можно, использовать, например, для кодирования цифр, скобок и знаков математических операций.

Соответственно, информационный вес символа в расширенном русском алфавите будет равен 6 бит. А текст, состоящий из 1000 символов будет иметь объем 6000 бит.

Данное следствие можно записать в виде формулы:

информационный объём сообщения I равен произведению количества символов К в сообщении умноженному на информационный вес символа алфавита i.

Измерять количество информации через длину двоичного кода придумал выдающийся российский математик Андрей Николаевич Колмогоров. Он решил, что количество информации, содержащийся в тексте, определяется минимально возможной длиной двоичного кода, необходимого для представления этого текста.

Зная ряд целых степеней двойки можно быстро определить информационный вес символа.

Если N – это мощность алфавита, оказывается не целой степенью двойки, тогда находят ближайшее к N значение во второй строке таблицы, но большее чем N. Причём значение i в первой строке будет равно информационному весу символа.

Рассмотрим пример. Необходимо определить информационный вес символа испанского алфавита, включающего в себя 54 строчные и прописные буквы; 10 цифр; 10 знаков препинания, скобок, кавычек.

Итак, сначала узнаем общее количество всех символов. Для этого нужно сложить все символы.

Теперь посмотрим на таблицу степеней двойки.

Это означает, что все 74 символа можно закодировать семиразрядными двоичными кодами.

В современных компьютерах чаще всего применяется восьмиразрядный код для двоичного представления текстов. Восьмиразрядный двоичный код позволяет получить 256 различных кодовых комбинаций, то есть 28 = 256.

Такой код содержится, например, в операционной системе Windows в кодовой таблице ANSI. Он включает в себя английские и русские буквы – прописные и строчные, цифры, знаки препинания, знаки арифметических операций, скобки и другое.

Для измерения информационного объёма памяти компьютера используются байты. Причём, 1 байт = 8 бит.

Рассмотрим пример. Пользователь компьютера, хорошо владеющий навыками ввода информации с клавиатуры, может вводить в минуту 100 знаков. Мощность алфавита, используемого в компьютере равна 256 символов. Нужно определить какое количество информации в байтах может ввести пользователь в компьютер за одну минуту.

Также для измерения информации используются кратные единицы.

Вся информация в компьютере представляется в виде двоичного кода. Это и тексты, и звуки, рисунки, видео и многое другое.

Объем информации любого вида, выраженный в битах равен длине двоичного кода, в котором эта информация представлена.

Рассмотрим пример. Учебник содержит 160 страниц. На каждой странице - 60 строк. В каждой строке 70 символов (включая пробелы). Нужно найти информационный объем текста, если используется восьмиразрядная кодировка.

Bтоги урока.

В компьютерных (цифровых) системах хранения и передачи информации применяется алфавитный подход измерения информации. Здесь используется двоичный способ кодирования информации и важен только размер или объём хранимого и передаваемого кода. Именно поэтому алфавитный подход также называют объёмным.

Информационный объем текста складывается из информационных весов всех символов, составляющих текст.

Объем информации равен длине двоичного кода

Основная единица: 1 бит — один разряд двоичного кода. А также применяются производные единицы: байт, Кб, Мб, Гб и Тб.

 

 

4350

Комментарии 0

Чтобы добавить комментарий зарегистрируйтесь или на сайт