Особенности построения
информационно-поисковых
систем
Информационно-поисковая система - совокупность информационно поискового правил перевода с естественного языка на информационно - поисковый и обратного перевода, а также критерия соответствия, предназначенная для осуществления информационного поиска.
Два основных способа поиска документа:
- использование иерархической модели
- использование гипертекстовой модели
Типовая схема ИПС
Информационный поиск –
процесс отыскания в некотором множестве текстов (документов) всех таких, которые посвящены указанной в запросе теме (предмету) или содержат нужные потребителю факты, сведения.
Информационно-поисковый язык –
знаковая система, предназначенная для описания (путём индексирования) основного смыслового содержания текстов (документов) или их частей, а также для выражения смыслового содержания информационных запросов с целью реализации информационного поиска.
В состав информационно-поискового языка входят: 1. Словарь индексационyых терминов - множество терминов индексирования. 2. Кодовый словарь - множество кодовых терминов. 3. Словарь входов - множество входных терминов. 4. Вспомогательные средства языка индексирования - средства, используемые совместно с индексационными терминами для расширения или сужения определенных понятий. 5. Правила использования языка индексирования.
Процедура поиска
По форме диалога, способу задания условия отбора и механизму поиска ИПС можно разделить на два класса:
системы рубрикационного типа ; (реализуются интерфейсом в виде иерархических последовательно раскрывающихся списков, через которые обеспечивается доступ к тематически связанным группам документов. Раскрывая очередную рубрику и перемещаясь, таким образом, по тематической иерархии, пользователь уточняет предметную область и увеличивает (усредненно) степень точности соответствия выдаваемых документов и информационной потребности. ) структурно-логические системы. (используются для работы с базами данных структурированной информации, когда каждый документ состоит из многих информационных полей, возможно, разного типа. Критерий отбора в этом случае строится как логическая комбинация простых, сводящихся к проверке условия присутствия или отсутствия в документе, слов (имен собственных или имен понятий, определяющих предмет поиска). )
ИПС для Интернета
Client (клиент) - это программа просмотра конкретного информационного ресурса. Такая программа обеспечивает просмотр документов WWW, Gopher, Wais, FTP-архивов, почтовых списков рассылки и групп новостей Usenet. User interface (пользовательский интерфейс) - способ общения пользователя с поисковым аппаратом: системой формирования запросов и просмотра результатов поиска. Search engine (поисковая машина) - служит для трансляции запроса на информационно-поисковом языке, в формальный запрос системы, поиска ссылок на информационные ресурсы Сети и выдачи результатов этого поиска пользователю. Index database (индекс базы данных) - индекс, который является основным массивом данных ИПС и служит для поиска адреса информационного ресурса.
Queries (запросы пользователя) - сохраняются в его (пользователя) личной базе данных. Index robot (робот индексирования) - служит для просмотра данных в Интернете и поддержания базы данных индекса в актуальном состоянии. Эта программа является основным источником информации о состоянии информационных ресурсов сети. WWW sites - это весь Интернет, или, точнее, информационные ресурсы, просмотр которых обеспечивается программами просмотра. Источником информации о состоянии информационных ресурсов сети является робот-индексировщик - это программа, которая по определенному алгоритму "заходит" на различные страницы, "читает" их и индексирует.
Банк данных.
Основные понятия
БнД = БД+СУБД
БнД = АС
Банк данных (БнД) – это АИС, включающая в свой состав комплекс специальных методов и средств для поддержания динамической информационной модели предметной области с целью обеспечения обработки информационных запросов пользователя.
Требования, предъявляемые к БнД:
- Удовлетворять актуальным информационным потребностям внешних пользователей, обеспечивать возможность хранения и модификации больших объемов многоаспектной информации
- Обеспечивать заданный уровень достоверности хранимой информации
- Обеспечивать доступ к данным только пользователям с соответствующими полномочиями
- Обеспечивать возможность поиска информации по произвольной группе признаков
- Удовлетворять заданным требованиям по производительности при обработке запросов
- Иметь возможность реорганизации и расширения при изменении границ ПО
- Обеспечивать выдачу информации пользователю в различной форме
- Обеспечивать возможность одновременного обслуживания большого числа внешних пользователей.
Преимущества централизации управления данными:
- Сокращение избыточности хранимых данных
- Устранение противоречивости хранимых данных
- Многоаспектное использование данных
- Комплексная оптимизация
- Обеспечение возможности стандартизации
- Обеспечение возможности санкционированного доступа
БнД
СУБД
БД
Вычислительные системы
Обслуживающий персонал
Словарь данных
ОС
Администратор банка данных
Технические средства