Методи пошуку інформації в мережі інтернет Інформаційно-пошукові системи

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Реферат

на тему:

«Методи пошуку інформації в мережі інтернет. Інформаційно-пошукові системи ».

2010

Зміст

Введення ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 3

1. Основні методи пошуку інформації в Інтернеті ... ... ... ... ... ... ... ...... ... .4

1.1 Безпосередній пошук з використанням гіпертекстових посилань .... ... 4

1.2 Використання пошукових машин ... ... ... ... ... ... ... ....... ... ... ... ... ... ... ... ... 4

1.3 Пошук з застосуванням спеціальних засобів ... ... ... ... ... ....... ... .... ... ... ... .. 5

1.4 Аналіз нових ресурсів ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ....... ... ... ... ... .. 5

2. Пошукові системи ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..... ... ... ... 7

2.1 Використання пошукових систем на Заході ... ... ... ....... ... ... ... .... ... .... ... 7

2.2 Історія пошукових систем ... ... ... ... ... ... ... ... ... ... ... ... ....... ... ... ... ... ... ... 8

3. Російськомовні пошукові системи ... ... ... ... ... ... ... ... ... ... ... .. ... ... .. ... ... 10

Висновок ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .11

Список використаних джерел ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 12

Введення

У наш ХХI століття, володіння інформацією, говорить про те, що людина освічена і респектабельний.

Більш-менш серйозний підхід до будь-якого завдання починається з аналізу можливих методів її рішення.

Пошук інформації в Інтернеті може бути проведений за кількома методами, значно розрізняються як по ефективності і якості пошуку, так і за типом витягуваної інформації.

У ряді випадків доводиться використовувати вельми трудомісткі методи - результат того вартий.

Пошукова система - програмно-апаратний комплекс з веб-інтерфейсом, що надає можливість пошуку інформації в Інтернеті.

У просторіччі під пошуковою системою увазі веб-сайт, на якій розміщений інтерфейс (фронт-енд) системи.

Програмною частиною пошукової системи є Пошукова машина (пошуковий движок) - комплекс програм, що забезпечує функціональність пошукової системи і є комерційною таємницею компанії-розробника пошукової системи.

1. Основні методи пошуку інформації в Інтернеті

Можна виділити наступні основні методи пошуку інформації в Інтернеті, які, в залежності від цілей і завдань, що шукає, використовуються окремо або в комбінації один з одним:

1.1 Безпосередній пошук з використанням гіпертекстових посилань

Оскільки всі сайти в просторі WWW фактично виявляються пов'язаними між собою, пошук інформації може бути здійснений шляхом послідовного перегляду пов'язаних сторінок за допомогою браузера.

Хоча цей повністю ручний метод пошуку виглядає повним анахронізмом у Мережі, що містить більше 60 млн. вузлів, "ручний" перегляд Web-сторінок часто виявляється єдино можливим на заключних етапах інформаційного пошуку, коли механічне "копання" поступається місцем більш глибокого аналізу.

Використання каталогів, класифікованих і тематичних списків і всіляких невеликих довідників також відноситься до цього виду пошуку.

1.2 Використання пошукових машин

Сьогодні цей метод є одним з основних і фактично єдиним при проведенні попереднього пошуку. Результатом останнього може бути список ресурсів Мережі, що підлягають детальному розгляду.

Як правило, застосування пошукових машин засноване на використанні ключових слів, які передаються пошуковим серверам в якості аргументів пошуку: що шукати.

Якщо робити все правильно, то формування списку ключових слів вимагає попередньої роботи зі складання тезауруса.

1.3 Пошук з застосуванням спеціальних засобів

Цей повністю автоматизований метод може виявитися досить ефективним для проведення первинного пошуку.

Одна з технологій цього методу заснована на застосуванні спеціалізованих програм - спайдерів, які в автоматичному режимі переглядають Web-сторінки, відшукуючи на них потрібну інформацію.

Фактично це автоматизований варіант перегляду з допомогою гіпертекстових посилань, описаний вище (пошукові машини для побудови своїх індексних таблиць використовують схожі методи).

Немає потреби говорити, що результати автоматичного пошуку обов'язково вимагають подальшої обробки.

Застосування цього методу доцільно, якщо використання пошукових машин не може дати необхідних результатів (наприклад, в силу нестандартності запиту, який не може бути адекватно заданий існуючими засобами пошукових машин).

У ряді випадків цей метод може бути дуже ефективний.

Вибір між використанням спайдера або пошукових серверів являє собою варіант класичного вибору між застосуванням універсальних або спеціалізованих засобів.

1.4 Аналіз нових ресурсів

Пошук по новоствореним ресурсів може виявитися необхідним при проведенні повторних циклів пошуку, пошуку найбільш свіжої інформації або для аналізу тенденцій розвитку об'єкта дослідження в динаміці.

Іншою можливою причиною може з'явитися те, що більшість пошукових машин оновлює свої індекси зі значною затримкою, викликаної гігантськими обсягами оброблюваних даних, і ця затримка звичайно тим більше, ніж менш популярна цікавить тема.

Це міркування може виявитися досить істотним при проведенні пошуку в вузькоспеціальної предметної області.

2. Пошукові системи

Більшість пошукових систем шукають інформацію на сайтах Всесвітньої павутини, але існують також системи, здатні шукати файли на ftp-серверах, товари в інтернет-магазинах, а також інформацію в групах новин Usenet.

Основними критеріями якості роботи пошукової машини є релевантність (ступінь відповідності запиту і знайденого, тобто доречність результату), повнота бази, врахування морфології мови.

Індексація інформації здійснюється спеціальними пошуковими роботами.

Останнім часом з'явився новий тип пошукових движків, заснованих на технології RSS, а також серед XML-даних різного типу.

Поліпшення пошуку - це одне з пріоритетних завдань сьогоднішнього Інтернету.

2.1 Використання пошукових систем на Заході

За даними компанії Net Applications в грудні 2007 року використання пошукових систем на Заході розподілялося таким чином:

Google - 77,04%

Yahoo - 12,46%

MSN - 3,33%

Microsoft Live Search - 2,57%

AOL - 2,12%

Ask - 1,38%

AltaVista - 0,13%

Excite - 0,07%

Lycos - 0,02%

All the Web - 0,02%

У вищенаведений звіт не входять російські пошуковики, такі як, наприклад, Яндекс, Рамблер або Nigma.

За даними аналітичної компанії comScore всі пошукові сайти в грудні 2007 року обробили 66 млрд 221 млн пошукових запитів.

Яндекс потрапив в статистику і знаходиться на 9-му місці.

2.2 Історія пошукових систем

Одним з перших інструментів пошуку в інтернеті (до WWW) був Archie.

Першою пошуковою системою для Всесвітньої павутини був «Wandex», вже не існуючий індекс, який створював «World Wide Web Wanderer» - бот, розроблений Метью Греєм (англ. Matthew Gray) з Массачусетського технологічного інституту в 1993.

Також в 1993 році з'явилася пошукова система «Aliweb», що працює до цих пір.

Першою повнотекстової, тобто індексуються ресурси за допомогою робота, пошуковою системою стала «WebCrawler», запущена в 1994.

На відміну від своїх попередників, вона дозволяла користувачам шукати за будь-яким ключовими словами на будь-який веб-сторінці - з тих пір це стало стандартом у всіх основних пошукових системах.

Крім того, це був перший пошуковик, про який було відомо в широких колах.

У 1994 був запущений «Lycos», розроблений в університеті Карнегі Мелона.

Незабаром з'явилася безліч інших конкуруючих пошукових машин, таких як «Excite», "Infoseek», «Inktomi», «Northern Light» і «AltaVista».

У певному сенсі вони конкурували з популярними інтернет-каталогами, такими, як «Yahoo!».

Пізніше каталоги з'єдналися або додали до себе пошукові машини, щоб збільшити функціональність.

У 1996 році російськомовним користувачам інтернету стало доступне морфологічне розширення до пошукової машини Altavista і оригінальні російські пошукові машини Rambler і Aport.

23 вересня 1997 була відкрита пошукова машина Яндекс.

Останнім часом завойовує все більшу популярність практика застосування методів кластерного аналізу і метапоіска.

З міжнародних машин такого плану найбільшу популярність здобула «Clusty» компанії Viv í simo.

У 2005 році на російських просторах за підтримки МДУ запущений пошуковик Nigma, що підтримує автоматичну кластеризацію.

У 2006 році відкрилася російська метамашіна Quintura, що пропонує візуальну кластеризацію у вигляді хмари ключових слів.

Nigma теж експериментувала з візуальною кластеризацією.

3. Російськомовні пошукові системи

Більшість «російськомовних» пошукових систем індексують і шукають тексти на багатьох мовах - українською, білоруською, англійською та ін

Відрізняються ж вони від «всеязичних» систем, індексуючих всі документи підряд, тим, що в основному індексують ресурси, розташовані в доменних зонах, де домінує російська мова або іншими способами обмежують своїх роботів російськомовними сайтами.

Яндекс (46,3% Рунета)

Mail.ru (8,9% Рунета)

Rambler (3,3% Рунета)

Nigma (0,5% Рунета)

Генон (0,1% Рунета)

Gogo.ru (<0,1% Рунета)

Aport (<0,1% Рунета)

З перерахованих пошукових систем не всі мають власний пошуковий алгоритм - так QIP.ru використовують пошуковий механізм Яндекса, Mail.ru використовує Google, а Nigma поєднує в собі як свій алгоритм, так і збірну видачу від інших пошуковиків.

Висновок

Пошук, із застосуванням пошукових машин, є поширеним і ефективним методом пошуку чогось конкретного в мережі Інтернет.

Хоча інші методи нічим не гірше, тільки вони застосовуються дуже рідко і лише в тому випадку, якщо за допомогою пошукової машини нічого не можна знайти.

Користуватися пошуковими машинами зручно і легко.

Список використаних джерел

1. http://www.ucheba.ru - УЧЕБА.RU

2. http://textbook.vadimstepanov.ru/index.html - ІНТЕРНЕТ У ПРОФЕСІЙНІЙ ІНФОРМАЦІЙНОЇ ДІЯЛЬНОСТІ

3. http://www.proweb.ru/articles/oglavlenie/glava4/poisk - Група компаній "вбудову«

4. http://newsmir.ucoz.ru/load/1-1-0-9 - Стрічка новин

5. http://simbiont-club.webzone.ru/search.htm - пошукові системи

6. http://www.seoded.ru/ssilki/poiskoviki.html - seoded.ru

Додати в блог або на сайт

Цей текст може містити помилки.

Програмування, комп'ютери, інформатика і кібернетика | Реферат
30.1кб. | скачати


Схожі роботи:
Довідково пошукові системи мережі Інтернет
Автоматизовані інформаційно пошукові системи
Організація зберігання та пошуку інформації в мережі Internet
Пошук і збереження інформації в мережі Інтернет
Web-сервери бази даних в Інтернет Пошук інформації в Інтернет Основні системи та засоби
Методи пошуку інформації в Інтернеті
Методи пошуку та аналізу інформації
Проблеми забезпечення безпеки інформації в мережі інтернет
Методи збору і пошуку інформації застосовуються в сучасній етнології
© Усі права захищені
написати до нас