Тема: Естественный язык как язык информационного моделирования. Инструктаж по ОТ и ТБ.
Цель: изучение особенности естественного языка как средства информационного моделирования и его роль в современном обществе.
Задачи:
образовательные: изучить основы NLP (науки об обработке естественного языка) и её применение в информационном моделировании.
развивающие: развить навыки анализа и обработки текстовой информации, научиться применять методы NLP для решения практических задач.
воспитательные: воспитать информационную культуру и ответственное отношение к использованию технологий NLP в профессиональной деятельности.
Оборудование: ноутбуки, наглядный материал (презентация), медиапроектор.
Ход урока.
Организация внимания.
Приветствие.
Работа с дежурными.
Проверка готовности к уроку.
Работа по осмыслению и усвоению нового материала.
Сообщение тему и цели урока.
Тема урока: Естественный язык как язык информационного моделирования. Инструктаж по ОТ и ТБ.
Цель нашего урока: изучение особенности естественного языка как средства информационного моделирования и его роль в современном обществе.
Изложение нового материала.
Обусловленность выбора языка моделирования
Человек строит информационные модели исходя из целей познания, общения и практической деятельности. Информационную модель можно создать выбрав некоторый язык. Для каждой из названных областей деятельности информационные модели строятся с использованием языка различной степени формализации.
Можно выделить:
Неформализованные языки ( прежде всего, естественные);
Формализованные
Формальные
Общение ( в более широком смысле коммуникация) происходит чаще всего на естественном языке (русском, английском, французском и пр.). Следовательно, в общении велик удельный вес информационных моделей, как словесное описание.
Результаты познания в целом для человечества отражаются в научных теориях, гипотезах, построениях. Универсальным языком науки считается в настоящее время язык математики, который можно отнести к формализованным языкам.
Математическое моделирование – это важный метод исследования и научного описания систем различной природы (физических, биологических, общественных, технических, лингвистических и пр.)
Практическая (профессиональная) деятельность тяготеет к использованию формальных языков при построении информационных моделей (конечно же, если она не имеет отношения к сфере искусств), что связано, прежде всего, с широким распространением компьютеров и компьютерных технологий.
Особенности естественного языка, языка математики и формализованных языков накладывают отпечаток на построение и восприятие информационных моделей, созданных с использованием этих языков.
Особенности естественного языка с точки зрения моделирования
Информационная модель, как говорилось выше, - это описание объекта на каком-либо языке. Чаще всего такое описание осуществляется на естественном языке.
Естественный язык имеет целый ряд своеобразных черт, например:
Многие слова имеют не одно, а несколько значений;
Значение отдельных слов и выражений зависят от их окружения (контекста);
Распространение синонимов
Многие соглашения относительно употребления слов не формулируются ясно, а только предполагаются, и для каждого правила есть исключение.
В информатике общепринято, что компьютер – это формальный исполнитель. Кажется, что используемый в компьютере в качестве основного язык двоичного кодирования и работа любого программного средства в соответствии с заранее заданным строго формализованным алгоритмом делают довольно сложным использование естественного языка.
Однако в настоящее время компьютер это не столько машина для вычислений, сколько именно «языковая машина», основа могущества которых, по мнению известного современного лингвиста Т. Винограда, «заключается в способности манипулировать лингвистическими знаками – символами, которым приписан некоторый смысл». Он подчеркивает также, что «естественный язык... занимает фактически центральное место в информатике».
Действительно, многие перспективные направления развития программного и аппаратного обеспечения компьютера связаны с предоставлением пользователю все больших возможностей по использованию естественного языка при работе за компьютером: системы речевого ввода команд (речевой интерфейс), лингвокорректоры, системы контекстного поиска информации в компьютерных сетях и пр.
Основные функции естественного языка с точки зрения моделирования
Основными функциями естественного языка являются:
Коммуникативная (функция общения);
Когнитивная (познавательная функция);
Эмоциональная (функция формирования личности);
Директивная (функция воздействия).
С точки зрения использования компьютера наибольший интерес для нас представляют коммуникативная и директивная функции языка:
Достаточно долго, вплоть до появления графического интерфейса, общение с компьютером сводилось к подобного рода директивам, то есть к некоторой системе команд, ключевые слова для которых выбирались из английского языка: Delete (удалить), Edit (редактировать), Make Directory (создать каталог), Rename (переименовать) и т.п. То же самое справедливо и для большинства процедурных языков программирования. Конечно же, языки программирования – строго формализованные языки, но в качестве элементов их конструкций используются слова и словосочетания обычных разговорных языков.
Особенности информационного моделирования в форме словесного описания на естественном языке
Естественный язык теснейшим образом связан с культурой народа – носителя языка. Языковые образы могут многое сказать о характерных чертах, мировосприятии и истории народа.
| Пример 3 Каждое слово каждого языка имеет свой, присущий только данному языку резерв сочетаемости. Например, русские сочетания крепкий чай, сильный дождь по-английски звучат как «сильный чай» (strongtea), «тяжелый дождь» (heavyrain). |
Основой языка являются языковые знаки. (В главе, посвященной формализации, мы уже рассматривали это понятие, но в более узком смысле.) Точное определение языкового знака, способы его образования, формы применения подробно рассматриваются в лингвистике. В качестве языкового знака могут выступать:
в устной речи – звук; слово или словосочетание, обозначающее предмет, событие, эмоцию, чувство, явление; фраза; текст (последовательность связанных по смыслу фраз) и пр.;
в письменной речи – буква; слово; предложение; текст и пр.
Строго говоря, изучать языковые знаки имеет смысл только в рамках некоторой знаковой системы. В конкретной знаковой ситуации знак условен, но в рамках знаковой системы можно обнаружить регулярность употребления знаков.
| Пример 4 Звук «p» может на письме передаваться разными буквами: «P», «p», «R», «r». Но в рамках одного языка, когда вы записываете слова, в которых встречается этот звук, вы будете использовать однотипное написание соответствующей буквы и вряд ли обозначите его, например, буквой «У»“” (конечно же, если речь не идет о шифрованном сообщении). |
Аспекты изучения и использования знаковой системы естественного языка
Выделятся три аспекта изучения и использования любой знаковой системы, в том числе естественного языка: синтаксис, семантика, прагматика. С этой триадой мы уже сталкивались, изучая различные аспекты информации.
Синтаксис
Среди всех возможных в данном языке слов, предложений, текстов выделяются правильные слова, предложения, тексты. Синтаксис языка фиксирует способы образования правильных (с точки зрения данного языка) языковых конструкций.
| Пример 5 Следующие три фразы записаны словами русского языка: 1.Книга лежит на столе. Первые две фразы синтаксически правильны, но если первая фраза имеет смысл, описывает конкретную ситуацию, то вторая фраза не имеет смысла (общепринятого). Третья фраза не соответствует правилам русской грамматики, она синтаксически неправильна, следовательно, семантически незначима. |
Заметим, что большинство компьютерных текстовых редакторов и автоматических переводчиков содержат модули автоматической проверки синтаксической правильности текста, работа которых основана на законах, открытых в лингвистике.
Семантика
Семантика знака (слова, предложения, текста) – это смысл, который содержится в этих языковых конструкциях. С точки зрения информатики особый интерес представляют:
преобразование текста, сохраняющее его смысл как в рамках одной знаковой системы, так и с переходом в другую знаковую систему – перевод текста (автоперевод);
преобразование текста, сохраняющее «главную» часть смысла – реферирование (автореферирование), контекстный поиск.
Что же касается естественного языка во всей его полноте, то он является главным хранителем интеллектуальных и духовных ресурсов общества, причем тех, о которых люди часто и не подозревают. Разъединение слова (знака) от вещи и скрытого в вещи смысла подрывает язык, а с ним и всю человеческую жизнь. Знаменитый русский языковед и собиратель сказок А.Н. Афанасьев говорил: «Забвение корня в сознании народном отнимает у образовавшихся от него слов их естественную основу, лишает их почвы, а без этого память уже бессильна удержать все обилие словосочетаний вместе с тем связь отдельных представлений, державшихся на родстве корней становится недоступной».
Прагматика
Прагматика отражает особенности восприятия знака адресатом, т.е. тем, для кого этот знак предназначался его автором. Один и тот же знак может восприниматься по-разному в зависимости от установки адресата.
| Пример 6 Если школьник любит лишь детективы и приключения, то в романе Л.Н. Толстого «Война и мир» он может воспринимать только то, что относится к войне. В этом случае данный роман воспринимается на уровне прагматики лишь как приключенческое произведение. Это тоже своеобразная прагматика. Пример 7 Сказки и мифы для ребенка – лишь увлекательное повествование. Для специалиста по истории и археологии языка сказки и мифы вполне поддаются научному анализу и реконструкции первоначального смысла. В мифологических сюжетах и образах он найдет и закодированные реальные события далекого прошлого, и отголоски стародавних общественных отношений и норм поведения, и представление о мироздании и его законах, и память о катастрофах в истории Земли и великих переселениях народов. Структуру всех трех аспектов знака в знаковой системе можно изобразить следующим образом.
Знаки, с одной стороны, обладают относительной устойчивостью, с другой – трансформируются с течением времени. Пример 8
|
Современная лингвистика, находясь в русле западноевропейской научной мысли, провозглашает автономию знака от обозначаемого объекта. При этом лингвистика понимает произвольность знака не так будто, он свободно может выбираться говорящим или пишущим. Произвольность языкового знака означает, что между знаком и означаемым нет никакой естественной связи. Однако это всего лишь первый шаг, ведущий к основному тезису формализации, т.е. утверждению о том, что человек может создавать языковые знаки по своему усмотрению и наделять их необходимым ему смыслом.
| Пример 9 Как известно, файлы в операционной системе можно назвать совершенно независимо от содержания. Однако, чтобы ориентироваться в них, между программистами и пользователями существует соглашение: имя файла должно, по возможности, отражать его содержание, а расширение имени файла – обозначать те программные средства, с помощью которых этот файл создан. Так, файлам, созданным в текстовом редакторе Microsoft Word, по умолчанию ставится расширение doc, файлам, созданным в Excel – расширение xls, выполнимым программам – расширение bat, com, exe, текстам программ на языке Pascal – расширение pas и т.д. |
Проблема взаимосвязи знака и обозначаемого
Автономность знака и обозначаемого порождает проблему их взаимосвязи. В привычной обстановке эта проблема возникает не часто, но что делать тогда, когда человек оказывается окруженным целым миром незнакомых знаков? Можно ли и как увидеть за ними обозначаемое? Это старая проблема. Разделение «вещи» и «слова» приводит к тому, что фактически любой язык становится для человека «незнакомым».
| Пример 10 Примечательно отношение к слову представителей различных культур. Древнегреческий философ Анаксимандр говорил о слове так: «Я открою вам ужасную тайну: язык есть наказание. Все вещи должны войти в язык, а затем вновь появиться из него словами в соответствии со своей отмеренной виной». Н.В. Гоголь ясно понимал всю глубину слова: «Обращаться со словом нужно честно. Оно есть высшей подарок Бога человеку... Опасно шутить со словом. Слово гнило да не исходит из уст ваших». Напротив, французский писатель А. Жид говорил: «Чтобы иметь возможность свободно мыслить, надо иметь гарантию, что написанное не будет иметь последствий». Отделенное от смысловых корней слово становится, с одной стороны, средством купли-продажи, с другой – превращается в орудие манипулирования человеческим сознанием. Пример 11 Многие слова, например «биржевой делец», «наемный убийца», «перекупщик» вызывают в нашем сознании целые пласты смыслов, прикрепляющих их ко всему строю отечественной культуры. Но если эти слова заменить соответственно на: «брокер», «киллер», «дилер», то они превращаются лишь в обозначения названных «профессий». Такой «перевод» родного языка на чужой есть один из приемов управления массовым сознанием посредством создания специальных информационных моделей. |
Итог урока
Что такое математическое моделирование?
Какой ряд своеобразных черт имеет естественный язык?
Что отражает прагматика?
Задавание на дом
Выучить записи в тетради .


Технологическая карта (189.16 KB)

