Меню
Видеоучебник
Видеоучебник  /  Информатика  /  7 класс  /  Информатика 7 класс (ФГОС)  /  Оценка количественных параметров текстовых документов

Оценка количественных параметров текстовых документов

Урок 52. Информатика 7 класс (ФГОС)

Как известно, вся информация, независимо от того, какая она: графическая, видео или звуковая – представляется в компьютере с помощью чисел, это всего два символа двоичного кода, 0 и 1, которые легко перевести в сигналы. На этом уроке учащиеся узнают, как в компьютере представляется текстовая информация. Какая таблица называется кодовой, какой код называется восьмиразрядным и что такое информационный объем текста.

Конспект урока "Оценка количественных параметров текстовых документов"

Вопросы урока:

·                   кодовая таблица;

·                   восьмиразрядный код;

·                   информационный объем текста.

Ежедневно каждый человек сталкивается с разными видами информации. Увидев важную информацию, можно записать её в компьютер, чтобы затем воспользоваться ей. В компьютер можно поместить фотографию своего друга или видеосъёмку о том, как вы провели каникулы. Но ввести в компьютер вкус мороженого или мягкость пледа никак нельзя.

Компьютер - это электронная машина, которая работает с сигналами. То есть он работать только информацией, которую можно превратить в сигналы. Если бы люди умели превращать в сигналы вкус или запах, то компьютер мог бы работать и с такой информацией.

Как вы уже знаете, вся информация, независимо от того, какая она графическая, видео или звуковая, представляется в компьютере с помощью чисел, это всего два символа двоичного кода, 0 и 1, которые легко перевести в сигналы.

Более 60% информации, представленной в компьютере, является текстовой информацией. В компьютерном алфавите 256 символов. Сюда входят заглавные и прописные буквы латинского и русского алфавитов, знаки препинания, печатные и непечатные символы, а также комбинации клавиш.  человек различает текст по начертанию символов.

А вот компьютер различает символы, которые вводят в компьютер, по их двоичному коду. Вы нажимаете на клавиатуре символьную клавишу, в компьютер мгновенно поступает определённая последовательность электрических импульсов разной силы, которую можно представить в виде цепочки из восьми нулей и единиц (двоичного кода).

Мы уже говорили о том, что разрядность двоичного кода i и количество возможных кодовых комбинаций N связаны соотношением:

Восьмиразрядный двоичный код позволяет получить 256 различных кодовых комбинаций, то есть:

С помощью 256 кодовых комбинаций можно закодировать все символы, расположенные на клавиатуре компьютера, — строчные и прописные русские и латинские буквы, цифры, знаки препинания, знаки арифметических операций, скобки и т. д., а также ряд управляющих символов, без которых невозможно создание текстового документа (удаление предыдущего символа, переход на новую строку строки, пробел и др.).

Для создания 256 комбинаций необходимо 8 ячеек, содержащих 1 или 0. Поэтому каждому символу компьютерного алфавита в памяти компьютера отводится регистр – 8 ячеек.

Чтобы информация на всех компьютерах читалась одинаково, были созданы различные таблицы кодов. В СССР – это КОИ7 и КОИ8, в Америке –ASCII. Для кодирования информации в Windows используют таблицу ANSI.

С помощью кодовых таблиц устанавливается соответствие между изображениями и кодами символов.

Кодовая таблица содержит коды для 256 различных символов, пронумерованных от 0 до 255. Первые 128 кодов во всех кодовых таблицах соответствуют одним и тем же символам:

·                   коды с номерами от 0 до 32 соответствуют управляющим символам;

·                   коды с номерами от 33 до 127 соответствуют изображаемым символам — латинским буквам, знакам препинания, цифрам, знакам арифметических операций и т. д.

·                   Коды с номерами от 128 до 255 используются для кодирования букв национального алфавита, символов национальной валюты и т. п.

Поэтому в кодовых таблицах для разных языков одному и тому же коду соответствуют разные символы. Более того, для многих языков существует несколько вариантов кодовых таблиц. Так для русского языка их более десятка.

Например, последовательности двоичных кодов:

в кодировке Windows будет соответствовать слово «Урок», а в кодировке КОИ-8 — бессмысленный набор символов.

Естественно, пользователь не будет каждый раз перекодировать текстовые документы, это делают специальные программы-конверторы, встроенные в операционную систему и приложения.

Однако, восьмиразрядные кодировки обладают одним серьёзным ограничением: их количество различных кодов символов не хватает, для того чтобы можно было одновременно пользоваться более чем двумя языками. Для того чтобы на компьютере можно было устанавливать больше языков был разработан новый стандарт кодирования символов, получивший название Юникод.

Юнико́д или Унико́д (англ. Unicode) — стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков.

Этот стандарт был предложен в 1991 году некоммерческой организацией «Консорциум Юникода».

С помощью этого стандарта можно закодировать очень большое число символов из разных письменностей: в документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы, при этом становится ненужным переключение кодовых страниц.

Универсальная система кодирования (Юникод) представляет собой набор графических символов и способ их кодирования для компьютерной обработки текстовых данных.

В Юникод каждый символ кодируется шестнадцатиразрядным двоичным кодом. Такое количество разрядов позволяет закодировать

 различных символов.

С каждым годом Юникод получает всё более широкое распространение.

Вам известно, что информационный объём сообщения

В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен:

•        8 битов или 1 байт — если используется восьмиразрядная кодировка;

•        16 битов или 2 байта — если используется шестнадцатиразрядная кодировка.

Информационным объёмом фрагмента текста будем называть количество битов, байтов или производных единиц (килобайтов, мегабайтов и т. д.), необходимых для записи этого фрагмента заранее оговорённым способом двоичного кодирования.

Перейдём к практической части урока.

Давайте практически найдём информационный объем текста.

Итак, Книга содержит 150 страниц. На каждой странице - 40 строк. В каждой строке 60 символов (включая пробелы). Нужно найти информационный объем текста, если используется восьмиразрядная кодировка.

Рассмотрим следующую задачу

Информационный объем текста, подготовленного с помощью компьютера, равен 3,5 Мегабайт. Нужно найти сколько символов содержит этот текст, если используется восьмиразрядная кодировка.

Рассмотрим следующую задачу

Информационное сообщение на русском языке, первоначально записанное в восьми - битном коде Windows, было перекодировано в шестнадцати - битную кодировку Unicode. В результате информационный объём сообщения стал равен 2 Мегабайта. Нужно найдите количество символов в сообщении.

Следующая задача.

Средняя скорость передачи данных по некоторому каналу связи равна 29 Килобит в секунду. Сколько секунд потребуется для передачи по этому каналу 50 страниц текста, если считать, что один символ кодируется одним байтом и на каждой странице в среднем 96 символов?

И последняя задача.

Пользователь компьютера, хорошо владеющий навыками ввода информации с клавиатуры, может вводить в минуту 100 знаков. Мощность алфавита, используемого в компьютере равна 256. Какое количество информации в байтах может ввести пользователь в компьютер за 1 минуту.

Пришло время подвести итоги урока.

Текст состоит из символов — букв, цифр, знаков препинания и т. д., которые человек различает по начертанию. Компьютер различает вводимые символы по их двоичному коду.

Соответствие между изображениями и кодами символов устанавливается с помощью кодовых таблиц.

В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может

быть равен:

• 8 бит (1 байт) — если используется восьмиразрядная кодировка;

• или 16 бит (2 байта) — если используется шестнадцатиразрядная кодировка.

Информационный объём фрагмента текста — это количество битов, байтов (килобайтов, мегабайтов), необходимых для записи фрагмента оговорённым способом кодирования.

8016

Комментарии 0

Чтобы добавить комментарий зарегистрируйтесь или на сайт