Методическая разработка по дисциплине информатика
Раздел 5.. Информационные технологии
Тема: «Информационно-поисковые системы»
Цели:
дидактическая: рассказать студентам об основах поиска информации в компьютерных сетях;
развивающая: развивать знания студентов в области информационных технологий;
воспитательная: показать важность знаний и умений в сфере информационных компьютерных технологий.
| Вид занятий (тип урока) | изучение нового материала |
| Организационные формы обучения | лекция |
| Методы обучения | беседа |
| Вид и формы контроля знаний | фронтальный опрос |
| Средства контроля
|
|
Ход занятия
1. Организационный момент.
2. Сообщение темы и цели занятия.
3. Изучение нового материала.
4. Повторение изученного материала.
5. Подведение итогов занятия.
6. Домашнее задание.
Изучение нового материала
Поисковые системы (синонимы: поисковик, поисковый сервер, поисковая машина) - инструмент для поиска информации в Интернете. Универсальная поисковая система – это комплекс программ и мощных компьютеров, выполняющих следующие функции:
специальная программа («паук») постоянно просматривает web-страницы и по ключевым словам составляет базы данных индексов. Web-сервер принимает от пользователя запрос на поиск информации и передает его специальной программе – «поисковой машине».
Поисковая машина просматривает базу данных, составляет список страниц, удовлетворяющих условиям запроса, и возвращает его web-серверу. Web-сервер оформляет результаты запроса и предает их на компьютер пользователя.
Технология эффективного поиска в Сети
При поиске информации выделяют следующие критерии: - полнота охвата информационного поля, в котором поиск происходит; - достоверность полученного результата; - скорость получения результата. Полнота зависит от качества запроса, составленного пользователем и возможностей конкретной поисковой системы. Достоверность результата зависит от особенностей функционирования поисковой системы, скорости обновления информации в предметной области, в которой осуществляется поиск Скорость получения результата зависит от характеристики каналов связи, особенностей организации работы поисковика, и, тем не менее, от «качества» построения запроса
Если на работу поисковых систем пользователь непосредственно влиять не может, то качество составления запроса – целиком в его компетенции. Приемы простого поиска Поиск группы слов
Слова «открытое» или «образование» дадут при поиске поодиночке большое число разнообразных ссылок, относящихся к совершенно различным темам, причем вряд ли имеющим отношение к «открытому образованию». Поэтому рекомендуется добавлять одно или два ключевых слова, связанных с искомой темой.
Например, «открытое образование» или «технологии открытого образования». Необходимо также сужать область вопроса. Если необходимо найти информацию о правовой системе Гарант, то запрос «правовая система гарант «выдаст более подходящие документы, чем просто «правовая система». Количество слов в группе не ограничивается.
Поиск словоформ
В большинстве случаев поисковая система по умолчанию ищет все словоформы языка. Однако, можно указать поисковой системе не перебирать все словоформы слов из запроса при поиске. Во многих системах для этого используется восклицательный знак.
Например, запрос «!кошкин» с большой вероятностью найдет страницы, цитирующие строчку из стихотворения «Кошкин дом». Роль прописных букв В случае если пользователь ввел в качестве запроса ключевое слово с прописной буквы, поисковая машина не найдет страниц, где содержится это слово, начинающееся со строчной буквы. Поэтому заглавные буквы в запросе рекомендуется использовать только в именах собственных. Например, «город Москва», «Марк Тулий Цицерон». Значение подстановочных символов
Когда нет уверенности в том, что поисковая система правильно обрабатывает словоформы (то есть когда речь идет, например, об именах собственных или словах иностранного происхождения) поисковые системы позволяют использовать подстановочные символы. Чаще всего это символ «» вместо любого количества любых символов до конца слова. Например, если пользователь хочет найти страницы, содержащие слова «республика Татарстан», но устроит и Татарская республика, тогда надо подать запрос «республика Татарс». Учет зарезервированных слов Зарезервированными словами (стоп-словами) считаются те слова, которые не учитываются при поиске. Обычно к ним относятся все короткие слова, в которые входят менее 4 букв (предлоги, союзы и т. п.).
Например, при запросе «мы в Италии» будут найдены документы, в которые входит слово «Италии» или его словоформы. Средства контекстного поиска
Если ключевые слова взять в кавычки, то поисковая система должна найти документы, в которых данная фраза присутствует буквально (поиск цитаты).
| Поиск информации | задача, которую человечество решает уже многие столетия. По мере роста объема информационных ресурсов, потенциально доступных одному человеку (например, посетителю библиотеки), были выработаны все более изощренные и совершенные поисковые средства и приемы, позволяющие найти необходимый документ.
Сначала эти средства совершенствовались в каталогах и информационных отделах крупных библиотек. В 70-е годы ХХ века появились базы данных, доступ к которым сначала обеспечивался через модемное подключение, а затем по протоколу telnet через Интернет. Стоимость работы с такими базами данных весьма велика. Например, одна минута работы с базой данных DIALOG (www.dialog.com) может стоить доллар, а вывод на экран одного элемента найденной записи (из, например, 70) — 20 центов. Такая высокая стоимость поиска информации потребовала создания эффективных приемов поиска. |
| Исследования по методам поиска информации публикуются | в научных журналах. В нашей стране — в журнале “Научная и техническая информация” (НТИ)
Все найденные за много лет средства и приемы поиска информации доступны и эффективны и при поиске информации в Интернет. |
| Виды каталогов | Библиотеки используют, в основном, три вида каталогов: алфавитные, систематические и предметные. |
Итак, АВТОР создает ДОКУМЕНТ. А у нас (у вас) возникает ИНФОРМАЦИОННАЯ ПОТРЕБНОСТЬ:

Эта информационная потребность часто (как правило) даже не может быть точно выражена словами, и выражается только в оценке просматриваемых документов — подходит или не подходит. В теории информационного поиска вместо слова “подходит” используют термин «ПЕРТИНЕНТНЫЙ ДОКУМЕНТ», а вместо «не подходит»— «не пертинентный’. Слово «пертинентный» происходит от английского «pertinent» что значит «относящийся к делу, подходящий по сути. Субъективно понимаемая цель информационного поиска — найти все пертинентные и только пертинентные документы (мы хотим найти «только то, что хотим, и ничего больше»).
Эта цель — недостижима. Мы часто в состоянии оценить пертинентность документа только в сравнении с другими документами (конечно, если цель нашего поиска — редактор для Quake, а попался документ с кулинарным рецептом, то он явно непертинентен, но принять решение о пертинентности документа так просто удается далеко не всегда). Для того, чтобы было с чем сравнивать, необходимо некоторое количество непертинентных документов. Эти документы называются — «ШУМ». Слишком большой шум затрудняет выделение пертинентных документов, слишком малый — не дает уверенности в том, что найдено достаточное количество пертинентных документов (раз мы видим только пертинентные документы, нет никакой уверенности в том, что и среди тех документов, которые не попались нам на глаза, тоже не окажутся пертинентные). Практика показывает, что когда количество непертинентных документов лежит в интервале от 10% до 30%, ищущий чувствует себя комфортно, не теряясь в море шума и считая, что количество найденных документов — удовлетворительно.
Когда документов много, используется информационно-поисковая система (ИПС). В этом случае информационная потребность должна быть выражена средствами, которые “понимает” ИПС — должен быть сформулирован ЗАПРОС:

Запрос редко может точно выразить информационную потребность. Однако многие ИПС по разным причинам не могут определить, соответствует ли тот или иной документ запросу. Степень соответствия документа запросу называется РЕЛЕВАНТНОСТЬЮ. Релевантный документ может оказаться непертинентным и наоборот. Известна (американская) ИПС, которая на запрос, состоящий из единственного слова «Russia» (Россия), выдает список документов, в первом из которых этого слова нет вообще, но зато есть слово «Gagarin» Этот документ нерелевантен, но пертинентен для массовой американской аудитории. В случае, когда ищется информация о шлюпочных якорях (кошках), запрос, состоящий из слова “кошка”, почти в любой ИПС даст массу релевантных, но непертинентных документов.
ПОВТОРЕНИЕ ИЗУЧЕННОГО МАТЕРИАЛА
РАБОТА ПО ЭЛЕКТРОННЫМ КАРТОКАМ ПО ВАРИАНТАМ
1. ВАРИАНТ
Опишите технологию эффективного поиска в сети
Слова «открытое» или «образование»
2. ВАРИАНТ
Опишите технологию эффективного поиска в сети
«открытое образование» или «технологии открытого образования».
Подведение итогов занятия. Выставления оценок, объяснение
Домашнее задание. Лекция – конспект, интернет ресурсы см. сноску

"Информационно - поисковые системы" (189.44 KB)

