Этот урок посвящён обобщению материала по теме. Сегодня мы с вами вспомним, что такое информация, как кодируется текстовая, графическая и звуковая информация в компьютере, а также, как представляется числовая информация в компьютере.
Начнём мы с вами с определения информации.
Информация – это сведения о предметах, событиях, явлениях и процессах окружающего мира. Она представляется и передаётся в форме знаков, рисунков, фотографий, схем; в виде световых или звуковых сигналов; в виде жестов и мимики; в виде запахов и вкусовых ощущений.
Информацию можно рассматривать с двух сторон: с точки зрения человека и с точки зрения компьютера.
Мы с вами будем рассматривать информацию с точки зрения компьютера. Для этого необходимо представить информацию в форме, понятной для компьютера, то есть в виде битов и двоичных кодов.
Минимальной единицей измерения информации принято считать 1 бит.
Разберёмся на примере.
Вычислить, какой объём информации будет занимать книга в электронном варианте, если известно, что книга содержит 16 страниц. На каждой странице – 16 строк, а в каждой строке – по 24 символа вместе с пробелами. 1 символ = 1 байту.
Для подсчёта объёма информации нам необходимо узнать количество символов в книге. Для этого умножаем количество страниц (16), на количество строк на каждой странице (также на 16), и на количество символов в каждой строке вместе с пробелами, то есть на 24.
16 · 16 · 24 = 6144 (символа).
Также мы с вами знаем, что 1 символ = 1 байту. То есть весь учебник в электронном варианте будет занимать объём, равный 6144 байтам.
6144 : 1024 = 6 (Кбайт).
Или же 6 Кбайт.
А сейчас давайте вспомним единицы измерения информации:
1 байт = 8 бит;
1 Кбайт (килобайт) = 1024 байта = 210 байт;
1 Мбайт (мегабайт) = 1024 Кбайта = 220 байт;
1 Гбайт (гигабайт) = 1024 Мбайта = 230 байт;
1 Тбайт (терабайт) = 1024 Гбайта = 240 байт;
1 Пбайт (петабайт) = 1024 Тбайта = 250 байт;
1 Эбайт (эксабайт) = 1024 Пбайта = 260 байт;
1 Збайт (зеттабайт) = 1024 Эбайта = 270 байт.
Помимо этого, существует такой подход к измерению информации, как вероятностный. При таком подходе объём занимаемой информации при условии, что число благоприятных исходов равно 1, будет вычисляться по следующей формуле:
.
Давайте разберёмся на примере.
Выполняется бросание симметричной восьмигранной фигуры. Она может с равной вероятностью упасть на любую из сторон. Какое количество информации мы получаем в зрительном сообщении от её падения на одну из граней?
Вероятность события p будет равна:
.
Т. к. вероятный благоприятный исход в данном случае может быть только один, а вот общее число исходов будет равно восьми, потому что фигура может упасть на одну из восьми сторон с одинаковой вероятностью.
Так как у нас фигура бросается один раз, то следует использовать следующую формулу:
Подставим p в формулу и получим следующее:
То есть в зрительном сообщении при бросании симметричной восьмигранной фигуры мы получим 3 бита информации.
Ещё один подход, который мы с вами рассмотрим, – алфавитный. Он применяется в компьютерных системах хранения и передачи информации. Здесь используется двоичный способ кодирования информации и важен только размер (объём) хранимого и передаваемого кода. Именно поэтому алфавитный подход также называют объёмным.
Разрядность двоичного кода i и количество возможных кодовых комбинаций или мощность алфавита N связаны следующим соотношением:
Также необходимо помнить, что 1 бит – это минимальная единица измерения информации.
А сейчас давайте разберёмся на примере. Какой объём будет занимать число F4, которое представлено в шестнадцатеричной системе счисления.
Приступим к решению.
Для начала вспомним, что:
.
Из этого следует, что все символы в этой системе счисления можно закодировать четырёхразрядными двоичными кодами от 0000 до 1111. То есть 1 символ = 4 битам. Соответственно, наше число в шестнадцатеричной системе счисления будет занимать объём:
2 ∙ 4=8 (бит).
Если же рассматривать число 71 в восьмеричной системе счисления, то:
8 = 23.
1 символ = 3 бита.
2 ∙ 3 = 6 (бит).
Объём информации, которое будет занимать число 71, равно 6 битам.
А сейчас переходим к видам информации, которые воспринимаются компьютером. К ним относятся текстовая, числовая, звуковая, графическая, мультимедийная. Все эти виды информации в компьютере кодируются.
Кодирование – это процесс представления информации в удобной для её хранения и/или передаче форме.
Начнём с рассмотрения текстовой информации в памяти компьютера. Каждая буква алфавита, цифра, знак препинания или любой другой символ, который нужен для записи текста, обозначается двоичным кодом, длина которого является фиксированной. Так, например, в системе кодирования Windows, таблица которого содержит 256 символов, каждый символ заменяется на восьмиразрядное целое положительное двоичное число, которое хранится в 1 байте памяти. Такое число является порядковым номером символа в кодовой таблице.
То есть под хранение 1 символа используется 8 бит или 1 байт. Также мы можем заметить, что два в восьмой степени равно двумстам пятидесяти шести.
Но такой кодировки достаточно лишь для одновременного кодирования не более чем 2 языков.
Для одновременной работы с большим количество языков в 1991 году был разработан новый стандарт кодировки символов – Юникод.
Юникод, или Унико́д (англ. Unicode), – это стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков.
В Юникод каждый символ кодируется шестнадцатибитовым двоичным кодом. Это говорит о том, что один символ будет занимать 16 бит или 2 байта. Также следует отметить, что 216 = 65 536. И именно такое максимальное количество символов будет содержать таблица Юникод.
Таким образом можно сделать вывод, что в зависимости от разрядности используемой кодировки, информационный вес символа текста, создаваемого на компьютере, может быть равен:
• 8 бит или 1 байт – при использовании восьмиразрядной кодировки;
• 16 бит или 2 байта – при использовании шестнадцатиразрядной кодировки.
Если же сравнивать таблицы кодировок Windows и Юникод, то можно сделать вывод, что при кодировании текста при помощи таблицы Юникод, его информационный объём будет в 2 раза больше, чем если бы мы кодировали этот же текст при помощи таблицы Windows. Но в то же время не стоит забывать, что при помощи таблицы кодировки Windows мы можем работать одновременно не более чем с 256 различными символами.
А теперь перейдём к кодированию графической информации.
Любое графическое изображение состоит из пикселей. Пиксель – это наименьший элемент изображения, получаемый с помощью компьютерного монитора или принтера. Для того, чтобы увидеть пиксель на изображении, нужно его увеличить.
А сейчас разберёмся непосредственно с кодированием графической информации.
Начнём с чёрно-белых изображений.
Каждый пиксель может иметь одно из двух состояний: чёрный или белый цвет. Для кодирования этой информации требуется 1 бит. Так, например, для кодирования чёрно-белого изображения, размер которого составляет 4 х 8 пикселей, нам понадобиться 32 бита или же 4 байта.
4 · 8 = 32 (бита).
32 : 8 = 4 (байта).
Современные компьютеры имеют просто огромные палитры цветов. Само же количество цветов в таких палитрах зависит от того, сколько двоичных разрядов отводится для кодирования цвета пикселя.
Если размер кода цвета равен b битов, то количество цветов (размер палитры) K вычисляется по формуле:
K = 2b.
Величину b в компьютерной графике называют битовой глубиной цвета.
Глубина цвета – это величина, обозначающая то, какое количество цветов или оттенков передаёт изображение.
В настоящее время наиболее распространены значения глубины цвета 8, 16 и 24 бита.
Разберёмся на примере. Нам дано изображение размером 16 х 16 при глубине цвета в 8 бит. Найти количество цветов в палитре и объём памяти, который будет занимать изображение.
Количество цветов в палитре находится по формуле:
K = 2b.
b = 8.
K = 28 = 256.
Для нахождения же объёма памяти, который будет занимать изображение, необходимо перемножить размеры изображения и всё это умножить на глубину цвета.
16 · 16 · 8 = 2048 (бит).
2048 : 8 = 256 (байт).
Переходим к кодированию звука в компьютере.
Для того, чтобы кодировать звуковую информацию, нужно её записать.
С помощью микрофона происходит запись звука в память компьютера, то есть преобразование непрерывных звуковых сигналов в непрерывный электрический сигнал. Но компьютер может работать только с цифровой информацией, поэтому для работы со звуком в компьютере необходимо его дискетизировать. Дискретизация – это процесс обработки информации при помощи звуковой карты или аудиоадаптера, в результате которой непрерывная информация преобразуется в прерывистую, состоящую из отдельных частей, последовательность нулей и единиц.
Звуковая карта – это устройство для записи и воспроизведения звука на компьютере.
То есть задача звуковой карты – с определённой частотой производить измерения уровня звукового сигнала и результаты измерения записывать в память компьютера. Этот процесс называют оцифровкой звука.
Количество измерений может лежать в диапазоне от 8000 (частота радиотрансляции) до 48 000 Гц (качество звучания аудио-CD).
То есть чем больше частота дискретизации, тем качественнее звук.
Промежуток времени между двумя измерениями называется периодом измерений – обозначается буквой t и измеряется в секундах.
Обратная величина называется частотой дискретизации. Она обозначается буквой 𝜈 и измеряется в герцах.
.
Таким образом на качество преобразования звука влияет несколько условий:
· частота дискретизации, то есть сколько раз в секунду будет измерен исходный сигнал;
· разрядность дискретизации – количество битов, выделяемых для записи каждого результата измерений.
При воспроизведении звукового файла цифровые данные преобразуются в электрический аналог звука. К звуковой карте подключаются наушники или звуковые колонки. С их помощью электрические колебания преобразуются в механические звуковые волны, которые воспринимают наши уши.
Таким образом, чем больше разрядность и частота дискретизации, тем точнее представляется звук в цифровой форме и тем больше размер файла, хранящего его.
Разберёмся на примере.
Определить качество звука (качество радиотрансляции или аудио-CD), если известно, что объём моноаудиофайла длительностью звучания в 10 секунд, равен 940 Кбайт. Разрядность аудиоадаптера равна 16 бит.
Рассмотрим решение. Для начала переведём 940 Кбайт в биты.
Мы знаем, что для того, чтобы найти размер цифрового аудиофайла, нужно время звучания или записи звука умножить на частоту дискретизации и умножить на разрядность регистра.
Отсюда мы можем найти . Для этого нужно размер аудиофайла разделить на произведение времени звучания и разрядности аудиоадаптера.
Мы получили частоту дискретизации, близкую к самой высокой. Запишем ответ: качество аудио-CD.
Нам осталось рассмотреть представление числовой информации в компьютере.
Числовая информация в компьютере может представляться в различных системах счисления. Основная же система счисления, в которой представляется информация в компьютере, – двоичная.
При выполнении каких-либо арифметических действий над числами, которые представлены в различных системах счисления, нужно перевести их в одну, например, в десятичную, а затем, после выполнения всех арифметических действий, перевести десятичное число в ту систему счисления, которая требуется по условию задания.
Для перевода числа, которое представлено в системе счисления с основанием q, в десятичную систему счисления, нужно:
1) перейти к его развёрнутой записи;
2) заменить буквы на соответствующие им числа в десятичной системе счисления, если таковые имеются;
3) вычислить значение получившегося выражения.
Для того, чтобы перевести целое десятичное число в систему счисления с основанием q, нужно:
1) последовательно выполнять деление данного числа и получаемых целых частных на основание новой системы счисления до тех пор, пока не получим частное, равное нулю;
2) полученные остатки, которые являются цифрами числа в новой системе счисления, привести в соответствии с алфавитом новой системы счисления.
3) составить число в новой системе счисления, записывая его справа налево, начиная с последнего полученного остатка.
Пришла пора подвести итоги урока. Сегодня мы с вами вспомнили, что такое информация, как кодируется текстовая, графическая и звуковая информация в компьютере, а также, как представляется числовая информация в компьютере.
У вас пропущена буква "р" в слове "дискретизировать" в этом фрагменте: ".необходимо его дискетизировать. Дискретизация – это."