Всесвітня павутина WWW гіпертекст пошукові машини

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

санкт-петербурзький державний

Університет економіки і фінансів

КАФЕДРА ІНФОРМАТИКИ

РЕФЕРАТ НА ТЕМУ (2 курс, 2 семестр):

«Всесвітня павутина www: гіпертекст, пошукові машини»

Виконала: студентка

238 групи Мельник О. М.

Перевірила: доцент кафедри інформатики

Камінська Т. Є.

Санкт - Петербург

2009

Всесвітня павутина WWW

Всесвітня Павутина - це сукупність інформаційних ресурсів, пов'язаних засобами телекомунікацій і заснованих на гіпертекстовому поданні даних, розкиданих по всьому світу. Всесвітня Павутина також позначається як WWW (World Wide Web), W3 чи просто Web.

Одиницею гіпертекстових даних Всесвітньої Павутини є Web-сторінка - мінімальний фрагмент гіпертексту, який можна завантажити і прочитати за один раз. Web-сторінка містить текст, графіку та посилання на інші Web-сторінки.

Для ідентифікації гіпертекстової сторінки в Мережі використовується так званий URL - Universal Resource Locator - Універсальний Локатор Ресурсів. У ньому міститься інформація про спосіб передачі даних між клієнтом і сервером (протоколі), імені сервера, на якому знаходиться сторінка, шляхи в дереві каталогів сервера, за якою знаходиться сторінка і імені сторінки.

Для представлення Web-сторінок використовується спеціальна мова розмітки гіпертексту - HTML (Hypertext Markup Language). Конструкції цієї мови - теги - дозволяють управляти шрифтом, кольором тексту і фону, визначати посилання, вставляти графіку, аудіо і відео і т.п. Самі теги при читанні сторінки не видно, а видно лише результати їх дії. Якщо порівняти, як виглядає сторінка в початковому тексті і вона ж на екрані браузера, то часом дивно, наскільки великі розбіжності.

Клієнта для WWW називають браузером. Браузер - це програма, яка завантажує і, інтерпретуючи теги HTML, показує в своєму вікні WWW-сторінки. Браузер відображає картинки в тілі сторінки, програє аудіо і відео, завантажує наступну сторінку, коли користувач клацає мишею по посиланню і т.д. і т.ін. для того, щоб зробити подорож по Всесвітній Павутині якомога комфортнішим.

Гіпертекст і web-сторінки

Гіпертекст (Hypertext) - це документ (у першу чергу текстовий), що містить гіперпосилання. Гіперпосилання - це зв'язок слова або міститься в документі зображення з іншим ресурсом, яким може бути як ще один документ, так і розділ поточного документа. Подібні "пов'язані" слова або картинки документа, як правило, виділяються з оформлення із загального тексту. Загальноприйнятою є практика підкреслення слова чи речення, пов'язаного гіперпосиланням.

Сам термін "гіпертекст" з'явився з виникненням електронних документів, задовго до появи служби WWW. Оскільки сучасні електронні документи містять не тільки текст, а й мультимедіа-інформацію, поняття гіпертексту було розширено до поняття гіпермедіа. Гіпермедіа - це метод організації мультимедіа-інформації на основі посилань на різні типи даних. Гіпермедіа-документи можуть використовуватися не тільки в WWW, але й, наприклад, в електронній енциклопедії на CD-ROM, де посилання в тексті часто веде на аудіо-або відеоролик.

Особливо продуктивною ідея гіпертексту виявилася стосовно до об'єднання цифрової інформації, розподіленої на серверах у всьому світі. Документ, доступний через Web, називають Web-сторінкою, а групи сторінок, пов'язаних загальним ім'ям, темою і об'єднаних навігаційно, - Web-сайтами. Першу сторінку, яку бачить користувач при зверненні на той чи інший ресурс, називають стартовою, домашньої або індексного сторінкою (home page). Система гіперпосилань визначає структуру Web-сайту. Сторінки на сайті можуть мати лінійну деревоподібну структуру, але частіше на кожній сторінці є кілька посилань, що й дозволяє говорити про структуру "павутина" (див. рис. 1)

Малюнок 1

Пошук інформації в Internet

Як правило, послідовність пошуку інформації в Internet виглядає наступним чином:

  1. Конкретизується область пошуку, виділяються ключові слова, характерні для області, що цікавить. Рекомендується по можливості підбирати такі слова, які не використовуються ні в яких інших областях діяльності або знання.

  2. На пошуковий сервер надсилається запит, сформований з ключових слів. На багатьох пошукових системах є можливість конкретизувати область пошуку шляхом вибору відповідних пунктів пропонованих меню.

  3. Так чи інакше, від сервера приходить список посилань на WWW-сторінки, в яких виявлено запитані слова з коротким описом кожного з них чи просто з невеликим початковим фрагментом сторінки.

  4. Далі слід дослідження відповідних (судячи по заголовку або опису) сторінок. Тут починається "вільне плавання", тобто перехід за посиланнями з текстом, який обіцяє щось цікаве.

  5. Збереження на диску цікавить матеріалу.

Відшукати потрібну інформацію в Сьомому океані - океані інформації було б просто неможливо якби не існувало пошукових серверів. Такі сервери надають можливість пошуку сторінок за ключовим словом або в ієрархічному дереві каталогу. Існують і суто англомовні і російськомовні, так і змішані сервери. Документів на англійській мові в Internet набагато більше, ніж російською, тому має сенс відвідати також і західні пошукові системи.

Для пошуку інформації за ключовим словом на пошуковий сервер надсилається запит. Запит формується автоматично - потрібно тільки ввести слова в полі введення, вибрати потрібні опції пошуку і натиснути кнопку. Зворотно приходить Web-сторінка із звітом про результати пошуку. Оскільки список знайдених документів може бути дуже великим, він розбивається на фрагменти по 10-100 елементів (на кожному сервері по-різному), а в кінці звіту наводяться посилання на такі фрагменти списку.

Кожен елемент звіту формується таким чином:

- На початку йде заголовок документа є також і посиланням на цей документ (якщо у документа немає заголовка - може бути й таке - то тут міститься напис 'No title');

- Далі йде невеликий фрагмент самого документа за яким практично завжди можна зрозуміти, про що йде мова в документі і, отже, підходить він вам чи ні;

- І, нарешті, список URL даного документа (один і той самий документ може бути продубльований за різними адресами).

Щоб перейти до документа, досить клацнути або по посиланню з текстом заголовка, або по одній з посилань з URL. До речі, єдиний пошуковик, який видає користувачеві не фрагмент документа, а справжню анотацію (англійською мовою), написану людьми - це Yahoo.

Другий метод відшукання документів, наданий пошуковими серверами - пошук по каталогах. Практично на всіх пошукових машинах є такі каталоги (виняток - Altavista, Rambler). У таких каталогах вся область знань розбивається на кілька великих підобластей, наприклад, мистецтво, бізнес, комп'ютери, освіта, спорт, політика, подорожі, здоров'я і т.д. і т.п. Далі кожна така підобласть розбивається на більш дрібні розділи і підрозділи. Таким чином у процесі пошуку ви на кожному кроці будете уточнювати шукане поняття, звужуючи область пошуку, поки не отримаєте список посилань на документи, вже більше відповідних потрібної вам теми.

Найбільш популярними англомовними пошуковими є: Yahoo, Magellan, Infoseek, Excite, WebCrawler, російськомовними: Rambler, Російська Машина Пошуку, всеязичним - Altavista, Altavista Telia.

Класифікація пошукових машин

Перша таблиця включає в себе провідні світові пошукові машини, які були першими пошуковими службами в мережі Інтернет. З їх допомогою користувачі можуть вести пошук, використовуючи ключові слова або логічні конструкції. Більшість служб використовує спеціальні мови запитів. Крім того, можна скористатися вже існуючої ієрархією каталогів. Наприклад, якщо ви шукаєте сайт певної газети, то потрібно слідувати по каталогу Yahoo! наступним чином:

News and Media>> Newspapers> The New York Times

Altavista і Yahoo! лідирують у цьому списку. На цих сайтах є велика база даних і добре структурована ієрархія. Euroseek незамінний при пошуку окремих європейських ресурсів.

Глобальні пошукові машини

Altavista - http://www.altavista.com

Yahoo! - http://www.yahoo.com

Lycos - http://www.lycos.com/

HotBot - http://www.hotbot.com

EuroSeek - http://www.euroseek.net/page?ifl=uk

Excite - http://www.excite.com

Infoseek - http://www.infoseek.com/

Оскільки всі перераховані вище пошукові системи використовують різні бази даних, то використовуючи одні й ті ж ключові слова, можна отримати зовсім різні результати. Іноді краще звернутися до так званих систем "мета-пошуку". Такі пошукові машини посилають ваш запит на величезну кількість різних пошукових систем. Потім обробляють отримані результати, видаляють повторювані адреси ресурсів і представляють більш широкий спектр того, що представлено в мережі Інтернет.

Системи мета-пошуку

Inference Find - http://www.inference.com/infind/

Meta Find - http://www.metafind.com/

Metacrawler - http://www.metacrawler.com/

Webcrawler - http://www.webcrawler.com/

Dogpile - http://www.dogpile.com/

Іноді з певної тематики Пошукова система видає таку величезну кількість посилань, що користувач просто не в змозі переглянути їх всіх і знайти краще. Northern Light і About.com (раннє відомий як The Mining Company) використовують послуги експертів, які вносять в базу даних найкращі ресурси. Ці сайти дуже інформативні і представляють дуже цінну інформацію.

Спеціальні пошукові системи

Northern Light - http://www.nlsearch.com/

About.com - http://about.com

Іноді вам необхідна сама загальна інформація. Для цього можна скористатися онлайновими енциклопедіями. У деяких випадках статті енциклопедії містять посилання на необхідні ресурси.

Енциклопедії

Енциклопедія Британіка - http://www.britannica.com/

Кирило і Мефодій - http://www.km.ru

Через неймовірного збільшення інформаційних ресурсів Інтернет в останні роки деякі старі пошукові системи перестали бути ефективними. Тому з'явилися такі пошукові машини, як Google і Direct Hit, які сортують посилання за принципом популярності. Використовуючи математичний алгоритм, вони видають адреси тих ресурсів, на які найчастіше вказують інші сайти.

Пошукові системи другого покоління

Google - http://www.google.com/

Direct Hit - http://www.directhit.com/

Висновок

Інтернет, міцно увійшовши у наше життя, зміг за дуже короткий час суттєво змінити її. Зараз інтернет - найбільш швидкий, надійний засіб спілкування та обміну інформацією між людьми. З його допомогою з'явилася можливість знаходження будь-інформації, що цікавить, без урахування її місця розташування, з'явилося таке властивість інформації, як загальнодоступність у світовому масштабі.

Список літератури

  1. Галанін С. «WWW - всесвітня павутина». http://iatp.ulstu.ru/edu/internet/www/

  2. Прохоров А.Н. «Всесвітня павутина (www)». / Http://www.intuit.ru/department/office/od/7/

  3. Пошукові машини Інтернет. / Http://www.pskov.org.ru/engines.html

  4. Пошукова система. Вікіпедія. /

http://ru.wikipedia.org/wiki/% D0% 9F% D0% BE% D0% B8% D1% 81% D0% BA% D0% BE% D0% B2% D0% B0% D1% 8F_% D1 % 81% D0% B8% D1% 81% D1% 82% D0% B5% D0% BC% ​​D0% B0

  1. Всесвітня павутина. / Http://dic.academic.ru/dic.nsf/ruwiki/18318

Посилання (links):
  • http://www.google.com/
  • http://www.directhit.com/
  • http://iatp.ulstu.ru/edu/internet/www/
  • http://www.intuit.ru/department/office/od/7/
  • http://www.pskov.org.ru/engines.html
  • Додати в блог або на сайт

    Цей текст може містити помилки.

    Програмування, комп'ютери, інформатика і кібернетика | Реферат
    31.3кб. | скачати


    Схожі роботи:
    Гіпертекст і мова гіпертекстової розмітки HTML
    Нелінійне подання інформації гіпертекст і його використання в комунікації
    WWW
    WWW 2
    Безпека www-серверів
    Пошукові системи Інтернету
    Пошукові спеціальні засоби
    Пошукові юридичні системи
    Інформаційно пошукові тезауруси
    © Усі права захищені
    написати до нас