Мережеві засоби пошуку інформації

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Каталоги

Обсяг інформації Інтернет переживає стрімке зростання: за оцінками експертів, кількість Web-сторінок збільшилась від кількох десятків тисяч у 1996 р. до декількох сотень тисяч до кінця 1998 р. У цих умовах ні одне окремо взяте засіб пошуку інформації не зможе охопити всіх ресурсів Мережі. Тому для ефективного вирішення завдання пошуку користувачу необхідно вільно орієнтуватися в складному і різноманітному світі пошукових інструментів. Правильний вибір засоби пошуку інформації в кожному конкретному випадку є істотною, якщо не визначальним, чинником успішного виконання завдання.

Каталоги являють собою систематизовані групи адрес, об'єднані, як правило, за тематикою. До зручності їх застосування можна віднести те, що, якщо користувачеві відома тема шуканого документа, він буде досліджувати відповідну гілку каталогу, не відволікаючись на сторонні, не відносяться до справи документи. Однак, обсяг каталогу обмежений фізичними можливостями редакторської групи і її суб'єктивністю у виборі матеріалу. У них відсутня інформація на вузькі, спеціальні теми, та й саму тематику шуканого документа не завжди можна сформулювати в межах класифікації каталогу.

Назва Опис
Yahoo! Найпопулярніший каталог, що містить велику інформацію про десятки тисяч Web-сайтів. Перший рівень ієрархії містить 14 тематичних категорій, які розгалужуються ще на 4 - 5 підрівнів. Має власну машину пошуку, яка дозволяє: 1) шукати по базi Yahoo!, по Usenet або за адресами електронної пошти, 2) обмежити пошук матеріалами, розміщеними в останній день, тиждень, місяць, рік або 3 роки; 3) видати статті, що містять хоча б одне ключове слово або всі ключові слова; 4) шукати за однокорінним словами або тільки за зазначеними ключовим; 5) видати результати по 10, 25, 50 або 100 на одній сторінці.
Excite Reviews Містить огляди 60 тис. вузлів Інтернет, систематизовані в ієрархічний каталог.
City.Net Каталог відомостей про різних країнах і містах.
Galaxy Ієрархічний каталог з детальним описом тематичних категорій на першій сторінці. Здійснює пошук по категорії пошуку, по одному або декільком ключовим словами, короткий і докладний висновок результатів пошуку, перехід на сторінки Gopher і Telnet.
Yellow Pages Пошук інформації про 16 млн. американських компаніях в різних галузях діяльності, а також персональні дані та електронні адреси приватних осіб.

Пошукові машини

У розділі курсу "Пошук інформації в Інтернет" ми розглянули принцип роботи пошукових машин: частина машини, звана «павуком» (або «Спайдер»), постійно подорожує по вузлах мережі, збираючи і оновлюючи інформацію, кодує її (індексація) і записує в спеціалізовану базу даних. При надходженні від користувача запиту у вигляді набору ключових слів машина досліджує свою базу даних і видає список документів, що містять ключові слова, як правило, ранжируваний в залежності від частоти входження ключових слів та інших характеристик.

До переваг застосування пошукових машин можна віднести величезний обсяг інформації, досліджуваної ними, і її періодичну актуалізацію. Однак, при цьому не враховуються документи, що не містять ключових слів, а, з іншого боку, в списку міститься багато шумовий, не відноситься до справи, відсіювання якої займає чимало часу.

Назва Опис
Lycos Охоплює 68 млн. сторінок. Можна вибрати параметри пошуку: одне, декілька ключових слів або фраза; усікання термінів; обмеження на кількість збігів; ступінь відповідності результатів пошуку ключовими словами; форму виведення результатів (коротку або детальну); кількість знайдених термінів на кожній сторінці. Невисокі швидкодію і оперативність оновлення інформації.
Alta Vista Охоплює більше 30 млн. сторінок на 225000 серверах, забезпечує доступ до 3 млн. статей в 14000 телеконференціях Usenet. Має два режими: Simple query і Advanced query. У режимі Simple можна вводити шаблони для пошуку не менш, ніж з трьома зазначеними символами на початку слова. Якщо слово містить хоча б одну велику літеру, ведеться пошук з урахуванням регістру. Нижче рядка введення видаються поради щодо пошуку. У режимі Advanced можна створювати складні запити, засновані на логічних операторів AND, OR, NOT, NEAR і вказувати критерії сортування отриманих результатів. Можна вказувати діапазон дат опублікування. Надає можливість пошуку зображень. Зручний інтерфейс. Висока швидкодія, різноманітне пошукове припис, можливість пошуку російською мовою з урахуванням морфології. Система не впорядковує результати пошуку, тому її доцільно застосовувати для специфічного або вичерпного пошуку.
Infoseek Guide Охоплює 1,5 млн. сторінок. Мова запитів дозволяє використовувати всі можливі варіанти логічних виразів. Менш повні, ніж на інших серверах, результати пошуку, незручний інтерфейс.
Infoseek Ultra 50 млн. сторінок WWW, можливий пошук російською мовою, пошук зображень.
WebCrawler Охоплює WWW, Usenet, Gopher, FTP, Telnet. Можливий пошук російською мовою. Простота в обігу, швидкість. Менш велика база вузлів, ніж на інших серверах.
HotBot Охоплює 54 млн. сторінок. Багатоваріантне пошукове припис. Можливий пошук російською мовою.

Мета-кошти пошуку

Мета-кошти пошуку дозволяють удосконалити процес шляхом запуску одночасно декількох засобів пошуку. Цей спосіб значно підвищує якість пошуку, об'єднуючи гідності і можливості всіх використовуваних коштів.

Проте, іноді пошук із застосуванням мета-засобів може виявитися дуже повільним, тому що їм доводиться координувати у часі надходження результатів обробки запиту від декількох серверів і проблеми, що виникли в одного з них, можуть призупинити роботу всієї системи. Ще одним недоліком мета-засобів є те, що вони не дозволяють використовувати можливості мови запиту кожного із застосовуваних пошукових засобів і не дають можливості заглянути в їх довідкові керівництва.

Назва Опис
MetaCrawler Підключає 9 пошукових систем одночасно. Перевіряється можливість доступу до знайденої інформації, відповідність вмісту заданому критерію. Можна сортувати інформацію з територіальної близькості, по близькості до певного вузла, по відношенню до компанії і т.д. Можливий пошук російською мовою. Є можливість персональної настройки інтерфейсу.
SavvySearch

Запускає одну з 4 груп, що складаються з трьох пошукових систем:

- WebCrawler, Yahoo!, Lycos
- Galaxy, Excite, DejaNews
- FTPSearch95, Yellow Pages, Infoseek
- Magellan, NlightN, PointSearch

Пошукове припис з використанням операторів AND і OR. Можливий пошук на багатьох мовах, у тому числі російською.

All-in-One

Добре структурована мета-машина, що має деревовидну класифікаційну структуру, на верхньому рівні якої розміщені групи:, весь Internet, особисті інтереси, ПЗ, сторінки приватних осіб, новини і погода, література і інше. Уточнюючи зміст кожної групи, можна потрапити на наступний рівень.

Використовує близько 200 пошукових засобів.

Internet Sleuth

Охоплює 1500 баз даних. Можна запустити одночасно до 10 пошукових систем з 24, наявних в меню. Використовує оператори AND, OR, NOT, усікання термінів. Для кожної пошукової машини можна задати свій критерій і своє обмеження часу пошуку.

Можливий пошук російською мовою. Тематичний пошук ведеться за великою кількістю періодичних видань і інформаційних служб багатьох країн. Для групи "НОВИНИ" використовується 39 джерел.

Російськомовні засоби пошуку

Каталоги

Назва Опис
ПАВУК Широке охоплення російськомовного WWW. Глибина пошуку: назва, перші рядки, електронна адреса документів. Підтримує всі російські кодування, можливість усікання термінів. Великий обсяг, розгалужена ієрархічна структура. Слабка оперативність оновлення інформації.
Сузір'я Інтернет Охоплює близько 400 серверів. Можливість усікання термінів. Містить назви та короткі характеристики серверів. Приваблива графіка. Невелика зона пошуку, слабка ієрархія.
Жовті сторінки Інтернет Близько 1200 Web-серверів. Великий обсяг інформації, добре продумана структура.
Russia on the Net Перший каталог російських ресурсів.
АУ! Молодий, швидко розвивається каталог.
Скарби Інтернет Каталог Web-ресурсів на сервері Relcom.

Пошукові машини

Назва 1. Зона пошуку
2. Глибина пошуку
3. Мова запиту
4. Висновок результату
5. Переваги і недоліки
Rambler 1. Близько 4000 Web-сайтів, тижневий архів телеконференцій Relcom.
2. Всі слова в документі.
3. Оператори AND, OR, NOT. Можливість усікання термінів. Обмеження за датою. Простий запит - 30 посилань, поглиблений - 1000.
4. Назва документа, резюме, розмір файлу, адреса, дата останнього оновлення, ступінь відповідності, кодування.
5. Зручний інтерфейс, висока швидкодія, повна інформація на виході. Слабка оперативність оновлення інформації.
Апорт! 1. 16 серверів.
2. Всі слова в документі.
3. AND та OR. Пошук по фразі (в подвійних лапках). Можливість усікання термінів. Чутливість до рядкових і прописних літер.
4. Назва документа, резюме, розмір файлу, адреса, дата останнього оновлення, ступінь відповідності запиту, кодування.
5. Зручність для користувача, високу швидкодію.
Російська Машина Пошуку 1. Більше 900 російськомовних вузлів.
2. Всі слова в документі.
3. AND та OR. Пошук по окремій фразі. Обмеження пошуку певними елементами Web-сторінок (назва, ключові слова, автор і т.д.). користувач може встановити або скасувати чутливість до рядкових і прописних букв і вказати кількість можливих помилок у шуканому слові, якщо немає впевненості в його написанні.
4. Назва документа, резюме, адреса, ступінь відповідності запиту.
5. Багатоваріантність пошукового розпорядження. Незвична форма видачі результату.
Яndex-Web 1. 5000 серверів - вся російська частина Інтернет, включаючи домени "RU", "SU", а також російськомовні ресурси в інших доменах.
2. Всі слова в документі.
3. AND, OR, NOT. Дозволяє здійснювати пошук усередині абзацу, документа, в заголовках та інших полях, а також із зазначенням відстані між словами. Пошук по фразі. Облік морфології російської мови. Чутливість до рядкових і прописних літер. Можливість простого й складного запиту. Пошук у знайденому.
4. Тема, початок тексту документа, розмір файлу, дата та адреса, ступінь відповідності запиту, кодування. Можливість "підсвічування" слів у тексті, відповідних пошуковому припису.
5. Індексація забезпечує нормалізацію слів і унікальність документа. Широке охоплення, зручний інтерфейс, висока швидкодія, висока оперативність оновлення інформації (раз на тиждень).

Даний опис не претендує на вичерпність охоплення засобів пошуку. Більш детальну інформацію можна отримати, вивчаючи інші варіанти списків пошукових засобів, доступні в Інтернет.

Додати в блог або на сайт

Цей текст може містити помилки.

Програмування, комп'ютери, інформатика і кібернетика | Реферат
22кб. | скачати


Схожі роботи:
Апаратні засоби виведення графічної інформації Засоби візуального відображення графічної інформації
Мережеві можливості Windows 9X за версіями Основні мережеві програми і їх призначення
Методи пошуку інформації в Інтернеті
Методи пошуку та аналізу інформації
Технологія зберігання пошуку і сортування інформації
Організація зберігання та пошуку інформації в мережі Internet
Методи збору і пошуку інформації застосовуються в сучасній етнології
Відчуття та сприймання як активні процеси пошуку та обробки інформації
Методи пошуку інформації в мережі інтернет Інформаційно-пошукові системи
© Усі права захищені
написати до нас