Обработка и хранение текстов
Ручная запись текста (печать на пишущей машинке) Хранение на бумажном носителе
Создание текстов на компьютере Хранение текстов на магнитном носителе в виде файлов
Недостатки бумажной технологии
Преимущества компьютерной технологии
- Проблемы редактирования (зачеркивание, стирание, заклеивание, переписывание заново)
- Внесение любых изменений непосредственно в файле, не расходуя при этом бумагу
- Книги, документы на бумажном носителе занимают много места
- Компактность хранения текстовой информации
- Одноразовое использование, перерасход бумаги
- Возможность многократного использования магнитного носителя
- Трудности копирования текстовых документов
- Легкость копирования файлов с помощью компьютера
- Трудности передачи информации на большие расстояния
- Оперативная связь (пересылка текстовых файлов по электронной почте через компьютерные сети)
Компьютерный алфавит
Компьютерный алфавит состоит из 256 символов
Информационный вес символа 8 бит (1 байт)
Каждый символ занимает 1 байт памяти
Таблица кодировки
символ
А …
№
двоичный код
65 …
01000001 …
Таблица кодировки – это стандарт , ставящий в соответствие каждому символу алфавита свой порядковый номер. Номер символа является его числовым кодом . В памяти компьютера коды символов представляются восьмиразрядным двоичным кодом
Кодирование символов
ASCII – Американский стандартный код информационного обмена
Стандартная часть таблицы: 0 (00000000) … 127 (01111111)
0 … 31 – управляющие символы;
32…127 – буквы латинского алфавита,
десятичные цифры,
другие символы
Вариативная часть таблицы:
(Кодовая страница)
128 (10000000) … 255 (11111111)
N
Символ
…
Двоичный код
82
R
83
0
…
S
127
1
0
1
0
128
1
Ђ
0
0
…
1
1
0
254
1
Ю
0
1
255
0
0
1
Я
0
0
1
1
0
1
0
1
1
1
1
0
1
1
1
0
1
1
1
0
1
1
1
1
1
0
1
1
0
1
1
ASCII – международный стандарт
Принцип последовательного кодирования алфавитов
Кодирование кириллицы :
Windows CP 1251 Кодировка
- Прописные и строчные буквы располагаются в алфавитном порядке
- Цифры располагаются по возрастанию значений
KOI8-R лПДЙТПЧЛБ
MS-DOS CP866 Љ®¤Ёа®ўЄ
Mac ЉодироЮка
ISO 8859-5 єЮФШаЮТЪР