Запросы для поисковых систем с использованием логических выражений
8 задание
Для быстрого поиска информации в Интернете используют поисковые запросы.
Поисковый запрос – это набор ключевых слов, соединенных знаками логических операций И, ИЛИ, НЕ.
Приоритет выполнения операций , если нет специально поставленных скобок, следующий: сначала НЕ, затем И, затем ИЛИ.
Нужно понимать, что операция И (одновременное выполнение условий) сокращает объем получаемого результата, а операция ИЛИ (выполнение хотя бы одного из условий) наоборот увеличивает объем.
Если в запросе стоит фраза в кавычках, система будет искать точно такую фразу целиком.
- 1. Расположение запросов по возрастанию (убыванию)
- Операция «И» (&) обозначает одновременное присутствие ключевых слов в искомых документах, а потому уменьшает количество найденной информации. Чем больше ключевых слов соединены операцией «И», тем меньше количество найденной информации. И наоборот, операция «ИЛИ» (|) обозначает присутствие хотя бы одного ключевого слова в искомых документах, а потому увеличивает количество найденной информации.
- Пример 1. В таблице приведены запросы к поисковому серверу. Расположите обозначения запросов в порядке возрастания количества страниц, которые найдет поисковый сервер по каждому запросу.
- А) реферат | математика | Гаусс Б) реферат | математика | Гаусс | метод В) реферат | математика Г) реферат & математика & Гаусс
- Решение:
- Самое маленькое количество страниц будет отобрано по запросу с наибольшим количеством операций «И» (запрос Г), Самое большое количество страниц будет отобрано по запросу с наибольшим количеством операций «ИЛИ» (запрос Б). По запросу А будет отобрано больше страниц, чем по запросу В, т.к. запрос А содержит больше ключевых слов, связанных операцией «ИЛИ».
Ответ: ГВАБ
2. Подсчет найденных по запросу страниц
Принцип отбора информации по поисковым запросам хорошо иллюстрирует диаграмма Эйлера-Венна (круги Эйлера).
На диаграмме множества изображаются пересекающимися кругами. Операция «И» (&) - это пересечение кругов, а операция «ИЛИ» (|) – это объединение кругов.
Например, обозначим кругами множества Яблоки, Груши, Бананы. По запросу Яблоки & Груши & Бананы будет отобрано пересечение (общая часть) всех трех кругов:
По запросу Яблоки | Груши будет отобрано объединение двух кругов:
Решение. По формуле включений и исключений имеем:
m(Крейсер | Линкор) = m(Крейсер) + m(Линкор) − m(Крейсер & Линкор)
m(Линкор) = m(Крейсер | Линкор) − m(Крейсер) + m(Крейсер & Линкор) = 4700 — 2500 + 600 = 2800.
Ответ: 2800.
В языке запросов поискового сервера для обозначения логической операции «ИЛИ» используется символ «|», а для логической операции «И» — символ «&».
Какое количество страниц (в тысячах) будет найдено по запросу Хорватия ? Считается, что все запросы выполнялись практически одновременно, так что набор страниц, содержащих все искомые слова, не изменялся за время выполнения запросов.
- Решение. По формуле включений и исключений имеем:
- m(Сербия|Хорватия) = m(Сербия) + m(Хорватия) − m(Сербия&Хорватия).
- Тогда 3000 = 2000 + m(Хорватия) − 500, откуда m(Хорватия) = 1500.
- Ответ: 1500.
Пример 2. В таблице приведены запросы и количество страниц, которые нашел поисковый сервер по этим запросам в некотором сегменте Интернета:
- Сколько страниц (в тысячах) будет найдено по запросу шахматы?
Пример 3. В таблице приведены запросы и количество страниц, которые нашел поисковый сервер по этим запросам в некотором сегменте Интернета:
- Сколько страниц (в тысячах) будет найдено по запросу
- Москва & (Париж | Лондон)
Несложно увидеть, что запросу Москва & (Париж | Лондон) соответствует область:
Ответ: 427