Спецкурс ”Основи Інтернету”
Розділ 3
Пошук в Інтернеті
Спеціальні програмні засоби для пошуку потрібної інформації в Інтернеті
підготував:
Учитель інформатики Ткач О.В.
Різновиди пошуку
Адреси каталогів
1. Веб - каталоги
- Веб-каталог – сайт, на якому зберігаються впорядковані за темами посилання на інші сайти. Список тем, за якими відсортовано посилання має ієрархічну структуру (від загальних тем до підтем – загальної тематики)
- Веб-каталоги — це один зі способів організації та категоризації сайтів. Це модеровані і тематично погруповані збірки сайтів.
Глобальні каталоги
- Каталог Yahoo — http://dir.yahoo.com
- ODP — http://dmoz.org
Українські каталоги
- http://zikave.at.ua/
- Український розділ ODP http://dmoz.org/World/Ukrainian/
- MavicaNET http://www.mavicanet.com/directory/ukr/ — Багатомовний пошуковий каталог.
2. Пошукові машини
Глобальний каталог Yahoo
http://dir.yahoo.com
Глобальний каталог ODP
http://dmoz.org
Український каталог
“ Цікава інформація “
http://zikave.at.ua/
Український розділ глобального каталогу ODP
http://dmoz.org/World/Ukrainian/
MavicaNET— Багатомовний пошуковий каталог.
http://www.mavicanet.com/directory/ukr/
Загальні підходи до пошуку інформації
Правила пошуку інформації
- Точно формулювати завдання
- правильно обирати засіб пошуку
- Чітко визначати початкову стратегію та критерії пошуку
Визначальний фактор під час отримання з Інтернету будь-якої інформації – правильно обрана стратегія пошуку.
Формулювання запиту
Запит до пошукової служби має складатися із загальних слів чи понять, які найточніше характеризують мету пошуку.
Завдання: Дізнатися в якому році було написано поему Шевченка “Гайдамаки”.
Запит: Шевченко Гайдамаки поема
Для отримання більш точних результатів доцільно використову4вати синоніми, або альтернативний опис поставленого завдання. Потрібна інформація може міститися в описі творчості письменника.
Запит: Шевченко творчість Гайдамаки
Фактори визначення якості знайденого матеріалу
Джерела наведеної на сторінці інформації
Мета, з якою надають інформацію
Частота оновлення сайту
Якість процитований джерел
Якість тексту
Стратегії пошуку інформації
1. Сформулюйте запит і виконайте пошук. Більшість пошукових систем запропонують лише ті сторінки, на яких згадано всі слова запиту, сторінки будуть показані в порядку зменшення релевантності (значущості)
2. Якщо результат вас не задовольняє, звузьте область пошуку. Використайте більше уточнювальних слів, або знайдіть слово, яке б чітко вказувало на шукане поняття.
3. Проаналізуйте результати пошуку. Можливо на одержаних сторінках є термін або слово, яке також можна використати для звуження області пошуку.
4. Якщо результат і надалі незадовільний, скористайтесь засобами розширеного пошуку і сформулюйте складніший критерій.
5. Якщо ж успіху так і не досягнули, спробуйте сформулювати запит інакше і знову застосуйте наведену методику.
Веб - каталоги
Завдання: Відшукати інформацію щодо одержання післядипломної освіти :
Вибираємо веб-каталог ( Мета ), в реєстрі сайтів вибираємо Наука і освіта , потім вибираємо Післядипломна освіта , знаходимо більш цікаву інформацію.
Веб-каталог – сайт, де зібрано величезну кількість посилань на інші сайти, відсортованих і розбитих по категоріях, залежно від теми сайту.
Кожний веб-каталог використовує свою систему класифікації, але більшість каталогів також мають власну систему пошуку за короткими описами сайтів і назвами категорій,а не за вмістом веб-сторінок, як у пошукових службах.
Найбільший у Всесвітній павутині веб-каталог - Open Directory Project
Каталог відомий як Mozilla ( http://dmoz.org/ ), містить посилання більше ніж на 4,5 мільйони сайтів.
Каталог складають добровольці (80 тис. чол.)
Каталог має посилання не лише на англомовні ресурси, але й на створені іншими мовами, зокрема українською .
Сайти в каталозі поділено на 16 категорій, кожна з яких містить підкатегорії.
В rатегорія World сайти відсортовано за мовою, якою їх створено.
Яндекс
Один із найбільших веб-каталогів російськомних ресурсів.
Містить посилання лише на російськомовні сайти.
Пошук здійснюється в усьому каталозі, незалежно від того, яку категорію відкрито, а для цього пошуку в поточній категорії потрібно встановити прапорець Только в этой категории.
http://yaca.yandex.ru
Якщо відкрито категорію Наука, Навчання, то буде виведено посилання на його рубрики, та ще посилання на освітні сайти, новини.
Мета
Український веб-каталог Мета, розміщений за адресою http://meta.ua/reestr.asp , має три мовні версії :
- українську,
- російську
- англійську.
Зайти на головну сторінку, вибрати Реєстр .
Зверху на сторінці є поле для введення пошукової інформації. Нижче - каталог.
Тут названо категорії, основні підкатегорії.
Внизу – список посилань навеб-сервіси порталу:новини, пропозиції роботи, розклад руху потягів тощо.
Принципи організації та використання пошукових серверів
Веб-каталоги складають за участю людини. Вони містять порівняно небагато інформації (до кількох мільйонів записів).
Бази даних пошукових машин генеруються автоматично і можуть бути дуже великими – їх обсяг у найбільших машинах (Google, Live Search, Yahoo!) становить кілька мільярдів записів.
Коли користувач підключається до пошукового сервера, задає критерії пошуку і переглядає одержані результати, він взаємодіє з пошуковою машиною цього сервера. Будь-який сайт, що має поле пошуку, можна вважати таким, що має пошукову машину.
Як влаштовано пошукові сервери
- Програми, які пошукова служба використовує для сканування сайтів Інтернету з метою пошуку нових і змінених документів, збирання інформації та її передавання індексувальним програмам.
- Програми, які пошукова служба використовує для сканування сайтів Інтернету з метою пошуку нових і змінених документів, збирання інформації та її передавання індексувальним програмам.
- Коли агент пошукової служби виявляє нову сторінку, він передає інформацію про неї індексувальній програмі, що сканує документ і заносить кожне слово до спеціального покажчика, який називається індексом.
- Коли агент пошукової служби виявляє нову сторінку, він передає інформацію про неї індексувальній програмі, що сканує документ і заносить кожне слово до спеціального покажчика, який називається індексом.
- Ця програма знаходить у базі даних інформацію про сторінки, що відповідають уведеному користувачем критерію. Крім пошуку, вона сортує знайдені записи так, що найважливіші з них відображаються на початку списку результатів пошуку.
- Ця програма знаходить у базі даних інформацію про сторінки, що відповідають уведеному користувачем критерію. Крім пошуку, вона сортує знайдені записи так, що найважливіші з них відображаються на початку списку результатів пошуку.
- Використовують для введення критерію пошуку й виведення результатів. Під веб-інтерфейсом зазвичай розуміють стартову сторінку сайту, де міститься поле для введення основного критерію пошуку й інших уточнювальних елементів, а також посилання на тематичні бази даних.
- Використовують для введення критерію пошуку й виведення результатів. Під веб-інтерфейсом зазвичай розуміють стартову сторінку сайту, де міститься поле для введення основного критерію пошуку й інших уточнювальних елементів, а також посилання на тематичні бази даних.
Компоненти пошукової машини:
Агенти (павуки, кроулери, роботи).
Індексувальна програма та індекс
Пошукова машина
Веб-інтерфейс
Задання критеріїв розширеного пошуку
Якщо запит складний, варто скористатися спеціальними елементами керування, які містяться на сторінці Розширеного пошуку. За допомогою полів і розкривних списків цієї сторінки можна складний критерій.
Кожна пошукова машина має свій набір параметрів пошуку і власні способи її введення.
Кілька стандартних можливостей:
- Введення шуканого тексту
- Визначення мови
- Вибір частини сторінки, на якій має міститися текст(URL сторінки, заголовок, гіперпосилання)
- Вибір сторінок,створених або модифікованих упродовж певного проміжку часу.
- Тип шуканих документів .
Пошукові машини дають змогу формувати критерії з використанням логічних операцій “І”, “АБО”, “НЕ”.
Критерії розширеного пошуку
- Пошук у тексту
- Пошук у заголовку
- Пошук із зазначенням конкретного URL або доменного імені
- Пошук гіперпосилань
- Пошук з урахуванням мови
- Пошук за датою
- Пошук файлів певного типу
- Логічні операції у критеріях пошуку
Робота із сторінками результатів
Використання кількох пошукових серверів
Бази даних пошукових серверів не ідентичні: через відмінності в механізмах збирання й індексування інформації, через наявність низки інших факторів кожна база містить записи,які відсутні в базах інших пошукових серверів.
Тому доцільно виконувати той самий запит на кількох найбільших машинах.
Огляд популярних пошукових серверів
Головна сторінка Live Search
Live Search
Google
Яндекс