Сегодня на уроке мы вспомним:
· какие выделяют подходы к измерению информации;
· как измеряется количество информации в текстовом сообщении, количество графической информации и объёмы звуковой информации;
· как найти скорость передачи информации.
Информация для человека – это набор сигналов, которые он получает из различных источников. Но один и тот же набор сигналов, одно и тоже сообщение может быть воспринято людьми совершенно по-разному. Давайте вспомним, как можно измерить информацию.
Выделяют два подхода к измерению информации: алфавитный и содержательный.
Алфавитный подход применяется в отраслях информатики связанных с использованием компьютеров. Этот подход основан на том, что любая информация, будь то текстовая, графическая, звуковая или видео, может быть закодирована с помощью конечной последовательности символов некоторого алфавита. В современных компьютерах для этого используется двоичный код. Получается, что в соответствии с алфавитным подходом минимальным количеством информации, а это, как мы знаем, один бит, будет такое количество информации, которое можно передать с помощью одного двоичного знака – нуля или единицы.
Содержательный подход применяется в математической теории информации. При этом подходе информацию рассматривают как знания, которыми обладает человек. Здесь важна качественная оценка информации. Информативное сообщение при содержательном подходе характеризуется содержащейся в нём полезной информацией, той частью сообщения, которое снимает полностью или уменьшает неопределённость какой-то ситуации. В данном случае информация – это снятая неопределённость. Неопределённость некоторого события – это количество возможных исходов данного события. В соответствии с этим подходом минимальная единица измерения информации – 1 бит – это количество информации, уменьшающее неопределённость в 2 раза.
Содержательный подход часто называют субъективным, так как все люди, субъекты, разные и воспринимают информацию об одном и том же по-разному.
Алфавитный подход всегда является объективным, то есть он не зависит от субъекта воспринимающего сообщения. А смысл сообщения при данном подходе не учитывается вообще.
Существует формула, связывающая между собой количество возможных информационных сообщений N и количество информации I, которое несёт полученное сообщение:
По приведённой формуле можно рассчитать, какое количество информации I несёт каждый из знаков. Если в алфавите N знаков, то количество информации, которую несёт каждый знак, можно рассчитать по следующей формуле:
Чем больше знаков содержится в алфавите, тем больше информации несёт один его знак.
Если количество символов алфавита равно N, а количество символов в записи сообщения – М, то информационный объем этого сообщения вычисляется по следующей формуле:
И равно М умножить на логарифм N по основанию 2.
Давайте рассмотрим задачу, где вспомним, как применить алфавитный и содержательный подходы.
Сколько информации несёт сообщение о том, что горит зелёный сигнал светофора? В данном случае рассматриваем светофор, у которого только два сигнала: красный и зелёный.
С точки зрения алфавитного подхода всё зависит от того, как закодирован сигнал в техническом устройстве. Согласно этому подходу, информативность последовательности символов определяется минимально необходимым количеством символов для её кодирования. На светофоре два различных сигнала: красный и зелёный. Достаточно одного бита, чтобы закодировать эти сигналы. Например, красный сигнал закодируем как ноль, а зелёный как единицу. В таком случае сообщение о том, что горит красный сигнал светофора, равно 1 биту.
Рассмотрим с точки зрения содержательного подхода. Здесь необходимо понять, какую неопределённость имеет человек, подходящий к светофору. Как мы помним, неопределённость – это количество возможных исходов события. В нашем случае исходов два. Первый – это загорелся красный свет, а второй – загорелся зелёный свет. Когда человек подошёл к светофору и увидел, что загорелся зелёный свет, то произошло одно из этих событий. Следовательно, неопределённость уменьшилась в 2 раза. Пешеход получил 1 бит информации.
Данный пример показывает, что алфавитный и содержательный подход не противоречат друг другу.
А теперь рассмотрим светофор, у которого 3 сигнала: красный, зелёный и жёлтый. Сколько информации в таком случае несёт сообщение о том, что горит красный сигнал светофора?
В задаче возможно 3 исхода: красный, зелёный и жёлтый сигнал, значит, N равно 3. Подставим N в формулу. Получаем, что количество информации равно 1.58 бит. В ответе получилось не целое число. Для содержательного подхода такой ответ подходит. Но так как в технических устройствах бит является наименьшей неделимой величиной, то при алфавитном подходе необходимо ответ округлить в большую сторону. Ответом будет 2 бита. И действительно, чтобы закодировать 3 разных сигнала, достаточно использовать 2 бита. Например, красный сигнал – это 00, зелёный – 01, а жёлтый – 10.
Определите количество информации для одной буквы алфавита, который содержит 28 букв.
Вспомним, как измеряется количество информации в текстовом сообщении.
Для кодирования текстовой информации, содержащей буквы, цифры, знаки препинания и другие специальные символы, используют различные коды.
Таблица кодировки – это таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера. Существует много различных таблиц кодировок текстовой информации.
Самой распространённой является таблица кодировок ASCII. В ней используется один байт для кодов информации. Если каждый код каждого символа занимает 1 байт, а это 8 бит, то с помощью такой кодировки можно закодировать 256 символов (28 = 256).
Таблица ASCII состоит из 2 частей: базовой и национальной.
Базовая часть является международным стандартом и содержит значения кодов от 0 до 127 – для цифр, операций, латинского алфавита, знаков препинания.
Национальная часть включает в себя коды от 128 до 255 для символов национального алфавита, то есть в национальных кодировках одному и тому же коду соответствуют различные символы.
Существует несколько разных кодировок второй части таблицы для кириллицы – КОИ8-Р, КОI8-P, Windows, MS-DOS, Macintosh, ISO.
Самой распространённой таблицей кодировки является Windows-1251.
При переносе русского текста между компьютерами или различными программами нередко могут возникнуть проблемы из-за разнообразия таблиц кодировок.
Так как объём в 1 байт достаточно мал для кодирования различных и многочисленных символов мировых алфавитов, то была разработана система кодирования Юникод Unicode. В ней используется 2 байта (16 бит) для кодов информации. Значит, система даёт возможность закодировать 65 536 символов.
Юникод – это стандарт кодирования символов, включающий в себя практически все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и других символов.
Вспомним, как измеряется количество графической информации.
Изображение на экране монитора формируется из отдельных точек – пикселей. В видеопамяти компьютера кодируются и сохраняются значения основных свойств пикселя – расположения и цвета. От пространственного разрешения и глубины цвета зависит качество изображения.
Разрешение – это величина, которая определяет количество точек (пикселей) на единицу площади. Разрешение монитора восемьсот на шестьсот означает, что изображение на экране будет состоять их шестисот строк, каждая из которых будет содержать восемьсот пикселей.
Глубина цвета – это объём памяти в битах, используемый для хранения и представления цвета при кодировании одного пикселя растровой графики или видеоизображения.
Для графических изображений
используются различные наборы цветов – палитры. Количество цветов в
палитре N
и глубина цвета I
связаны между собой соотношением:
Для определения информационного объёма видеоизображения нужно умножить количество информации одного пикселя на количество пикселей в изображении:
где Х – это количество точек изображения по горизонтали, а У – это количество точек изображения по вертикали.
Для количественного описания цвета существует несколько цветовых моделей.
В основе модели RGB лежат 3 основных цвета: красный, зелёный и синий. Остальные цвета создаются путём смешения их оттенков.
В современных компьютерах для представления цвета чаще всего используют от 2 до 4 байт.
2 байта (16 бит) дают возможность различать 216 = 65 536 цветов и оттенков. Такой режим представления изображений называется High Color.
Соответственно 4 байта (32 бит) дают возможность различать 232 ≈ 4,3 млрд цветов
и оттенков. Такой режим представления изображений называется True Color.
А основными цветами модели CMYK являются голубой, жёлтый, пурпурный и чёрный. Чаще всего данная модель используется в полиграфии.
Определите объём изображения, если известно, что оно создано в режиме High Color и занимает весь экран в 800 на 600 пикселов.
Найдём объём изображения как произведение количества пикселей в нём на количество байтов в кодировке цвета:
800 ∙ 600 ∙ 2 = 960 000 байт.
Переведём число в килобайты.
960 000 байт / 1024 = 937,5 Кб.
Ответ: 937,5 Кб.
Графическое изображение имеет размер 30×5. Каков информационный объём изображения, если оно чёрно-белое?
В палитре используется только 2 цвета, значит глубина цвета 1 бит:
2
1
бит.
Тогда информационный объём изображения равен:
I=Iпикселя ∙ Х ∙ Y = 1 ∙ 30 ∙ 5 = 150 бит.
Ответ: 150 бит.
Вспомним, как измеряются объёмы звуковой информации
Звук – это непрерывный сигнал. Чтобы использовать звук в компьютере, его преобразуют в цифровой сигнал. Как мы помним, такое преобразование называется дискретизацией: для кодирования звука выполняют его измерение с определённой частотой (несколько раз в секунду).
Качество представления звука в компьютере определяют частота дискретизации и точность представления измеренных значений. Значит, чем выше частота дискретизации и чем больше количество разных значений, которыми можно характеризовать сигнал, тем выше качество отображения звука.
Частота измеряется в Гц. Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 за 1 секунду – это 1 кГц. Характерные частоты дискретизации для современных компьютеров – это 22 кГц, 44,1 кГц и так далее.
Также вспомним, как найти скорость передачи информации.
Скорость передачи информации – это количество информации, переданное в единицу времени, то есть объём двоичного кода, который передан за одну секунду.
Скорость передачи информационных сообщений чаще всего измеряется в битах за секунду. Но могут использоваться и другие единицы измерения.
Данные объёмом 2 Кб были переданы через некоторое соединение за 256 миллисекунд. Какое время в миллисекундах может занять передача через то же соединение данных объёмом 1024 байта?
Так как при решении нужно учитывать соотношение между различными единицами измерения, то запишем все числа в виде степеней двойки:
2 Кб = 2 ∙ 210 байт = 211 байт.
256 мс = 28 мс.
1024 байт = 210 байт.
Далее определим время передачи одного байта через соединение:
28 мс / 211 байт = 2-3 мс.
Затем найдём время второй передачи данных.
2-3 ∙ 210 = 27 = 128 (мс).
Ответ: 128 миллисекунд.
В конце урока попробуйте ответить на следующие вопросы:
Что такое таблица кодировки?
Как выглядит формула, связывающая между собой количество возможных информационных сообщений и количество информации, которое несёт полученное сообщение?
Что такое глубина цвета?
Как называется величина, которая определяет количество точек (пикселей) на единицу площади?
Внимательно посмотрев урок, вам не составит труда ответить на вопросы.