Організація зберігання та пошуку інформації в мережі Internet

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Курсова робота
по
На тему: "Організація зберігання та пошуку інформації в мережі Internet"

Введення
Інтернет як засіб інформації в Росії поки не може конкурувати з традиційними ЗМІ, але має в цьому відношенні великі перспективи і зможе надалі виступати нарівні з іншими інформаційними ресурсами.
В даний час понад 500 млн. людина більш-менш регулярно користуються
Інтернетом, а через два роки їх число, на думку експертів, перевищить 1 млрд., іншими словами, більше 16% населення Землі. Зрозуміло, така колосальна аудиторія не могла залишитися незатребуваною - Інтернет давно перетворився у величезну інформаційний майданчик.
У всьому світі, а тепер і у нас в країні, наявність працюючого Web-сайту стає ознакою стабільної, професійної роботи фірми. Інтернет давно вже став не тільки засобом спілкування, але і полем для серйозної комерційної діяльності. Практично кожна закордонна фірма має в Мережі своє представництво, віртуальний офіс. Сумарний оборот компаній, що ведуть торгівлю в Інтернет, досягає мільярдів доларів. У Росії також усе більше число компаній використовує Інтернет для просування своїх товарів і послуг. У цьому легко переконатися, переглянувши рекламні видання. Поруч зі звичними номерами телефонів і факсів все частіше і частіше зустрічаються адреси електронної пошти та Web-сайтів. Скоро відсутність адреси в Інтернет буде ускладнювати роботу так само, як відсутність факсу. Той, хто займе собі місце зараз, істотно виграє в майбутньому. Це оперативність і актуальність. Традиційні засоби масової інформації при всій їх наочності і звичності вже не здатні забезпечити належний рівень оперативності, потрібний сучасній людині. Тому все більше і більше людей звертаються до Інтернету, щоб отримати найсвіжішу інформацію: про послуги і ціни, погоду, курси валют, просто новини. На Web-сайті можна змінювати інформацію кілька разів на день. У друкованих виданнях треба замовляти рекламу мінімум за тиждень, а то й більше. А в Інтернет все оперативно: нові товари або послуги, нова знижка або новий постачальник - завтра про це дізнаються клієнти. Немає необхідності чекати, поки вийде черговий випуск друкованої реклами. Інформація на сайті буде завжди актуальною, найсвіжішої. Саме це цінують, саме це приваблює в Інтернет мільйони користувачів.

1. Зберігання даних в мережі Internet
1.1 Гіпертекстові документи, види файлів
Під гіпертекстовим документом розуміють документ, що містить так звані посилання на інший документ. Реалізовано все це через протокол передачі гіпертексту HTTP (HyperText Transfer Protocol).
Інформація в документах Web може бути знайдена за ключовими словами. Це означає, що кожен оглядач Web містить певні посилання, через які утворюються так звані гіперзв'язку, що дозволяють мільйонам користувачів Internet вести пошук інформації по всьому світу.
Гіпертекстові документи створюються на базі мови HTML (HyperText Markup Language). Ця мова дуже простий, керуючі коди його, які, власне, і компілюються оглядачем для відображення на екрані, складаються з тексту ASCII. Посилання, списки, заголовки, картинки і форми називаються елементами мови HTML, які дозволяють клацанням миші перейти до перегляду іншого документа.
Існує два способи створення гіпертекстових документів. Можна скористатися одним з WYSIWYG HTML-редакторів (наприклад, Netscape Composer, основи роботи з якому розглянуті в розділі «Обробка тексту на ЕОМ», Microsoft FrontPage, HotDog, або ін), для роботи з якими не потрібно спеціальних знань про внутрішню структуру створюваного документа. Цей спосіб дозволяє створювати документи для WWW без знання мови HTML. HTML-редактори автоматизують створення гіпертекстових документів, позбавляють від рутинної роботи. Проте їхні можливості обмежені, вони сильно збільшують розмір одержуваного файлу і не завжди отриманий з їх допомогою результат відповідає очікуванням розробника. Але, безумовно, цей спосіб незамінний для новачків у справі підготовки гіпертекстових документів.
Альтернативою є створення і розмітка документа за допомогою звичайного редактора plain-тексту (таких, як emacs або NotePad). При цьому способі в текст вручну вставляються команди мови HTML. Створюючи документи таким способом, ви точно знаєте, що робите.
Як вже зазначалося, HTML-документ містить символьну інформацію. Одна її частина - власне текст, тобто дані, що становлять вміст документа. Інша - теги (markup tags), звані також прапорами розмітки, - спеціальні конструкції мови HTML, які використовуються для розмітки документа і керують його відображенням. Саме теги мови HTML визначають, у якому вигляді буде представлений текст, які його компоненти будуть виконувати роль гіпертекстових посилань, які графічні або мультимедійні об'єкти повинні бути включені в документ. Графічна та звукова інформація, що включається в HTML-документ, зберігається в окремих файлах. Програми перегляду HTML-документів (браузери) інтерпретують прапори розмітки і розташовують текст і графіку на екрані відповідним чином. Для файлів, що містять HTML-документи, прийняті расшіренія.htm ілі.html.
Прописні і малі літери при записі тегів не розрізняються. У більшості випадків теги використовуються парами. Пара складається з відкриваючого (start tag) і закриває (end tag) тегів. Синтаксис відкриваючого тега:
<Імя_тега [атрибути]>
Прямі дужки, які використовуються в описі синтаксису, означають, що даний елемент може бути відсутнім. Ім'я закриває тега відрізняється від імені відкриває лише тим, що перед ним ставиться похила риса:
</ Імя_тега>
Атрибути тега записуються в наступному форматі:
ім'я [= "значення"]
Лапки при завданні значення аргументу не обов'язкові і можуть бути опущені. Для деяких атрибутів значення може не вказуватися. У закриває тега атрибутів не буває.
Дія будь-якого парного тега починається з того місця, де зустрівся відкриває тег і закінчується при зустрічі відповідного закриває тега. Часто пару, що складається з відкриваючого і закриває тегів, називають контейнером, а частина тексту, облямовану відкриває і закриває тегом, - елементом.
Послідовність символів, складова текст, може складатися з прогалин, табуляцій, символів переходу на новий рядок, символів повернення каретки, букв, знаків пунктуації, цифр, та спеціальних символів (наприклад, +, #, $, @), за винятком наступних чотирьох символів , що мають у HTML спеціальний зміст: <(менше),> (більше), & (амперсенд) і "(лапки). Якщо необхідно включити в текст будь-якої з цих символів, то слід закодувати його особливою послідовністю символів.
До спеціальних символів можна віднести і нерозривний пробіл. Використання цього символу - один зі способів збільшити відстань між деякими словами в тексті. Звичайні прогалини використовувати для цих цілей не можна, так як група поспіль прогалин інтерпретується браузером як один.
1.2 Графічні файли, їх види і особливості
В даний час використання повнокольорової якісної графіки реалістичних квітів на комп'ютерах класу ПК виглядає повсякденним. Хоча не так давно це було привілеєм видавничих систем, які зазвичай будувалися на платформах Macintosh або графічних станцій Silicon Graphics. Користувачі ПК задовольнялися ж у крайньому випадку графікою з кольором, глибиною максимум 8 біт / піксель (256 кольорів) при досить слабкою роздільної здатності 320х200 або ж 16 квітами при вирішенні 640Х480.
Зараз, з розвитком архітектур відеоадаптерів і здешевленням відеопам'яті на різних мікросхемах, середньостатистичному користувачу цілком доступні системи на платформі ПК, які успішно працюють з реалістичними (TrueColor) зображеннями глибиною 24 біта / піксель (більше 16 млн. кольорів).
У зв'язку з технічним прогресом виникла потреба у перенесенні на платформу ПК і адаптації різних форматів кодування і зберігання графічної інформації з інших платформ (наприклад Macintosh, де подібні розробки розвиваються протягом вже другого десятка років), або ж розробка власних, орієнтованих на ПК графічних форматів , повністю враховують всі особливості архітектури їх відеоадаптерів.
Більш того, в останні 5 років у зв'язку з блискавичним поширенням Internet і, зокрема, технологій World Wide Web, стала вставати проблема іншого роду - розробка форматів зображень досить компактних для передачі в мережі з мінімальними затримками та апаратно незалежних, так як до мережі підключені комп'ютери самих різних архітектур.
У зв'язку з цим, хотілося б коротко розглянути кілька поширених графічних форматів і коротко охарактеризувати їх можливості. Всі ці відомості зведені в нижченаведену таблицю:
Формат
Макс. глиб. кольору
Макс. число квітів
Макс. розмір зображення,
піксел
Методи
стиснення
Кодування декількох зображень
BMP
24
16'777'216
65535x65535
RLE *
-
GIF
8
256
65535x65535
LZW
+
JPEG
24
16'777'216
65535x65535
JPEG
-
PCX
24
16'777'216
65535x65535
RLE
-
PNG
48
281'474'976'710'656
2147483647x
2147483647
Deflation (LZ77)
-
TIFF
24
16'777'216
всього 4'294'967'295
LZW, RLE та інші *
+
Крім цього, слід зазначити, що найбільш компактними є формати JPEG, GIF, PNG, які, до того ж, переносних незалежні. Формат BMP є стандартним форматом Windows, проте великого поширення не отримує з-за непомірних розмірів файлів, особливо при збереженні графіки з глибиною кольору 24 біт / піксел. Що стосується формату TIFF слід зауважити, що він, як і JPEG, GIF, є частково платформо-незалежним, проте дуже об'ємний для використання в мережі і, що ще гірше, занадто складний для інтерпретації. Крім того будь-які програмні вироби, в тому числі і просмотровщик графічних файлів, що містять код для кодування / декодування даних за алгоритмом LZW повинні поширюватися за відповідним ліцензійною угодою компанії Unisys Corp., Власника алгоритму, що додатково здорожує ці продукти.
Подальший розгляд мені хотілося б звернути до міжплатформна форматам, прийнятим в Internet в якості стандарту де-факто: JPEG, GIF, PNG.
Відразу хочу помітити, що формату PNG (Portable Network Graphic) не буде приділено багато уваги, хоча, можливо, він його і заслуговує. Це є наслідком того, що формат цей з'явився не так давно і не дивлячись на всі свої достоїнства ще не знайшов загального визнання.
Отже, фактично перед людиною або компанією, яка має намір розміщувати на своїх дисках велика кількість зображень і, можливо, надавати їх для використання в Internet, постає дилема: що вибрати GIF або JPEG.
Формат GIF, розроблений компанією CompuServe, і спочатку пропонувався саме як формат для обміну зображеннями в мережі є форматом з досить високим ступенем стиснення зображення. Крім того, GIF володіє додатковими можливостями, які роблять його використання в мережі привабливим. Перша - це можливість зміни порядку виведення на екран рядків зображення, із заповненням проміжків між ними тимчасового інформацією. Візуально це виглядає так, що в міру завантаження з мережі (що відбувається нерідко з катастрофічно низькою швидкістю) зображення на екрані з'являється як би «в низькій якості», а потім, у міру підвантаження додаткової інформації, відновлює пропущені рядки зображення. Таким чином, користувач ще до закінчення процесу завантаження може отримати уявлення про вміст зображення і перервати завантаження непотрібного файлу великого розміру. Друга можливість полягає в зберіганні в одному файлі більш ніж одного зображення, що робить можливою елементарну покадровую анімацію. Ще однією відмінною особливістю GIF є те, що один із квітів можна оголосити «прозорим», і тоді при виведенні зображення ті його частини, які пофарбовані цим кольором не будуть виводитися на екран і під ними буде видно фон, на який зображення накладається. Найбільшим же недоліком GIF є те, що він може зберігати зображення, що складається максимум з 256 кольорів, що останнім часом стає все менш і менш прийнятним. Разом з цим, користувачів GIF переслідує така ж неприємність, що і у випадку з форматом TIFF: GIF також використовує LZW-стиснення, а отже, кожне зображення може поширюватися лише за наявності відповідного ліцензійної угоди.
Формат JPEG є TrueColor-форматом, тобто може зберігати зображення з глибиною кольору 24 біт / піксел. Такий глибини кольору досить для практично точного відтворення зображень будь-якої складності. Більш глибоке уявлення кольору (наприклад, 32 біт / піксель) реально виявляється практично не відрізняється від даного при перегляді на сучасних моніторах і при роздруківці на більшості доступних принтерів. Така глибина кольору може виявитися корисною хіба тільки у видавничій діяльності. JPEG в загальному має більш високим ступенем стиснення зображень, ніж GIF (докладніше цей аспект описаний у розділі «Практики використання JPEG»), але не володіє можливістю зберігати декілька зображень в одному файлі. Нещодавно була розроблена модифікація формату JPEG, що отримала назву Progressive JPEG, що приблизно можна перекласти на російську мову як «поступовий JPEG», який призначений для тих же завдань, що і чересстрочной відображення GIF-зображень. Це зробило формат JPEG ще більш привабливим як мережевий стандарту. Однак, і в JPEG присутні свої недоліки. На відміну від GIF, який може ефективно стискати зображення практично будь-якого змісту, JPEG орієнтований насамперед на реалістичні зображення, тобто зображення фотографічної спрямованості, і якість стиснення значно погіршується при обробці зображень з чітко окресленими лініями і кордонами кольорів.
Таким чином, не можна до цих пір зробити остаточного вибору на користь одного або іншого формату. Однак, мені формат JPEG видається цікавішим з точки зору оригінального алгоритму стиснення і великих можливостей для розвитку в перспективі. Також формат JPEG слід вважати однозначно більш гнучким: він дозволяє вибирати між гарною якістю зображення або високим ступенем стиснення і знаходити прийнятний компроміс для кожного конкретного випадку. Тому все подальше дослідження присвячене саме цього формату.
1.3 Пошукові системи та правила пошуку інформації
Зручність Інтернету в тому, що в ньому можна знайти практично будь-яку інформацію, навіть коли ми не знаємо точно, де вона знаходитися. Якщо адреса сторінки з цікавлять нас матеріалом невідомий і сторінки з підходящими посиланнями теж немає, доводиться розшукувати матеріали по всьому Інтернету. Для цього застосовують пошукові системи Інтернету - спеціальні web-вузли, що дозволяють знайти потрібний документ.
Існує два основні методи пошуку в Інтернеті. У першому випадку ви шукайте web-сторінки, пов'язані з певною темою. Пошук здійснюється шляхом вибору тематичної категорії і поступовим її звуженням. Подібні пошукові системи називають пошуковими каталогами. Вони зручні, коли вам потрібно ші познайомитися з новою для себе темою або дістатися до широко відомих «класичних» ресурсів з даної теми. Другий спосіб пошуку використовується, коли тема носить вузький, специфічний характер або потрібні рідкісні, маловідомі ресурси. У цьому випадку ви повинні уявляти собі, які ключові слова повинні зустрітися в документі за цікавить вас. Ці слова треба вибрати таким чином, щоб вони, швидше за все, малися на потрібних документах, що не мають відношення до обраної теми. Системи, які дозволяють виконувати такий пошук, називають пошуковими покажчиками. Пошукові каталоги відрізняються від пошукових покажчиків не тільки методом пошуку, але й способом формування. Будь-яка пошукова система Інтернету складається з двох частин. Спеціалізована web-сторінка, доступна всім бажаючим і дозволяє виконувати пошук, спирається на велику, постійно поповнюється і оновлюється базу даних, яка містить відомості про ресурси Інтернету.
Спосіб поповнення цієї бази даних залежить від типу пошукової системи, пошукових каталогів найголовніше - це точність відбору. Кожен знайдений ресурс повинен бути корисним. Тематика сторінки визначається або перевіряється вручну. Через це обсяг пошукових каталогів відносно невеликий. Коли об'єм наближається до мільйона сторінок, обсяг ручної праці настільки великий, що подальше зростання каталогу зупиняється.
Пошукові покажчики, навпаки, орієнтовані на широту охоплення. З визначенням слів, наявних на web-сторінці, цілком справляється автоматика, даних пошукового покажчика може охоплювати багато мільйонів web-сторінок. При цьому виконувати пошук в покажчику важче, ніж в каталозі, тому що одні ті ж ключові слова можуть зустрічатися на web-сторінках, присвяченим різним темам.
Інформаційно-пошукові системи розміщуються в Інтернеті на загальнодоступних серверах. Основою пошукових систем є так звані пошукові машини, або автоматичні індекси. Спеціальні програми-роботи (відомі також як павуки) в автоматичному режимі періодично обстежують Інтернет на основі певних алгоритмів, проводячи індексацію знайдених документів. Створені індексні бази даних використовуються пошуковими машинами для надання користувачу доступу до розміщеної на вузлах Мережі інформації. Користувач в рамках відповідного інтерфейсу формулює запит, який обробляється системою, після чого у вікно браузера видаються результати обробки запиту. Механізми обробки запитів постійно вдосконалюються, і сучасні пошукові системи не просто перебирають величезна кількість документів. - Пошук ведеться на основі оригінальних і вельми складних алгоритмів, а його результати аналізуються і сортуються таким чином, щоб представлена ​​користувачеві інформація найбільшою мірою відповідала його очікуванням.
В даний час у розвитку пошукових систем спостерігається тенденція об'єднання автоматичних індексних пошукових машин і який складають вручну каталогів Інтернет-ресурсів. Ресурси цих систем вдало доповнюють один одного, в об'єднання їх можливостей цілком логічно.
Тим не менш дослідження можливостей пошукових машин, навіть самих потужних з них, таких як AltaVista або HotBot, показують, що реальна повнота охоплення ресурсів Всесвітньої павутини окремої такою системою не перевищує 30%. Тому не варто обмежуватися використанням якої-небудь однієї з них. Якщо вам не вдалося відшукати цікаву для вас інформацію за допомогою однієї системи, спробуйте скористатися іншою.
Кожна пошукова Система має свої особливості і, і якість отриманого результату залежить від предмета пошуку та точності формулювання запиту. Тому, приступаючи до пошуку інформації, перш за все, потрібно чітко уявляти собі, що саме і де ви хочете знайти. Наприклад, закордонні системи вражають числом проіндексованих документів. Для пошуку в області професійних знань, особливо інформації іноземною мовою, такі системи, як AltaVista, HotBot або Northern, підходять найкращим чином.
Однак для пошуку інформації російською мовою, особливо в російській частині Інтернету, краще пристосовані російські пошукові машини. По-перше, вони спеціально орієнтовані саме на російськомовні ресурси Мережі і, як правило, відрізняються більшою повнотою охоплення і глибиною дослідження ці ресурсів. По-друге, російські системи працюють з урахуванням морфології російської мови, тобто в пошук включаються всі форми шуканих слів. Російські системи краще враховують і таку історично сформовану особливість російських Інтернет-ресурсів, як співіснування кількох кодувань кирилиці.

2. Огляд і характеристика пошукових систем мережі Internet
2.1 Rambler
Для пошуку російськомовної інформації в Інтернеті краще використовувати російські пошукові системи. У цей досвід і в наступних інших ми будемо шукати інформацію за допомогою декількох систем, призначених для пошуку в російськомовній частині Інтернету. Як ви побачите, принципово вони не відрізняються від всесвітніх пошукових систем. Так як ми вже розглянули кілька систем, і ви знаєте загальні принципи пошуку інформації в Інтернеті, то в подальших дослідах ми не будемо детально зупинятися на всіх тонкощах. Так як ці системи спілкуються з вами російською мовою, то ви зможете самостійно вивчити їх, використовуючи знання, отримані вами під час виконання попередніх дослідів.
Виконаємо пошук за допомогою системи Рамблер. Як ви побачите, ця система має зручною системою пошуку і видачі знайденої інформації.
Ви можете виконати пошук як у Всесвітній павутині, так і в групах новин, а також в каталозі цієї системи і в товарах. Крім простого запиту є можливість роботи з детальними запитами. Але ми виконаємо простий запит, як і для інших російських пошукових машин.
Ø Введіть в поле введення запиту слова пошук Інтернет. Ми хочемо знайти документи, одночасно містять слово «пошук» і слово «Інтернет».
Ø Натисніть кнопку Знайти!. Ми отримали список знайдених сторінок.
Список знайдених сторінок зручно організований. Спочатку розташовані посилання на сторінки, найбільш відповідають критеріям пошуку. Найбільш повно задовольняють запиту документи, в яких шукані слова часто повторюються і стоять недалеко один від одного. Крім того, в короткому фрагменті тексту знайденого документа виділені виявлені ключові слова.
У системі Рамблер можна подивитися слова, які найбільш часто використовуються в запитах користувачів. Крім того, Рамблер веде список найбільш популярних Російських вузлів Інтернету. Так як вся інформація в системі представлена ​​російською мовою ми сподіваємося, що ви зможете самостійно надалі познайомитися з можливостями даної пошукової машини.
2.2 Yandex
Пошукова система Яndех розташовується за адресою www.уаndех.ru. Вона була офіційно введена в експлуатацію 23 вересня 1997 року.
Що ж таке Яndех? Ось як відповідають на це питання творці системи. Яndех - це повнотекстова інформаційно-пошукова система (ІПС), що враховує морфологію російської та англійської мов. Система Яndех призначена для пошуку інформації в електронних текстах різної структури і різних способів подання (форматів). Яndех (вимовляється «Яндекс») розшифровується як «мовний індекс» або, в англійському написанні, Yandex - Yet Another INDEX. Також можна розглядати Яndех як частковий переклад слова Index з англійської на російську мову («I» означає «Я»).
В основі пошукової системи Yandex. Ru лежить системне ядро, спільне для всіх продуктів з префіксом Яndex (Яndex. Site, Яndex. Lib, Яndex. Dict, Яndex.СD). Перші продукти серії Яndex (Яndex. Site, Яndex. Dict) були представлені широкій публіці 18 жовтня 1996 на виставці Netcom'96. Пошукова машина для «російського Інтернету». стала природним продовженням лінії Яndex. Як вже говорилося, в хорошому питанні міститься половина відповіді. Шукати і знаходити потрібне у купі текстів в Інтернеті - уміння не тільки пошукової системи, мо і користувача, задає запит. Яndex не вимагає від користувача знання спеціальних команд для пошуку. достатньо набрати питання («де знайти дешеві комп'ютери» або «потрібні телефони Москви і Московської області»), і ви отримаєте результат - список сторінок, де зустрічаються ці слова. Незалежно від того, в якій формі ви вжили слово в запиті, пошук враховує всі його форми за правилами російської мови. Наприклад, якщо заданий запит йти, то в результаті пошуку будуть знайдені посилання на документи, що містять слова «йти», «йде», «йшов», «йшла» і т.д.
Яndex працює не тільки з мовними запитами, але і дозволяє виконувати пошук тільки на певних серверах АБО ж виключити з пошуку свідомо непотрібні сервери. З'явилася можливість пошуку зображень за підписами до них і по іменах файлів. Також стали доступними для пошуку такі об'єкти, як сценарії, аплети та стилі (пошук здійснюється за назвою). Зручна робота з новими можливостями пропонується на сторінці розширеного пошуку, де складну мову запитів зведений до заповнення полів у формі. Окрім стандартної сортування результатів - за релевантністю (тобто за ступенем відповідності запиту), можна відсортувати документи за датою оновлення. Цікавою особливістю системи є можливість пошуку в Яндексі в будь-якому місці Інтернету. Для цього потрібно завантажити з сайту http://bar.уаndех.ru програму підлогу назвою Яндекс. Бар і встановити її. Після цього у вікні браузера з'явиться нова панель. Вона призначена для введення запиту на пошук (без необхідності відкривати сторінку Яндекса) і виконання ряду інших функцій.
За зовнішнім виглядом Яндекс являє собою типовий портал, на головній сторінці якого можна знайти посилання на матеріали практично будь-якої тематики. Але це не єдина його особа, для «серйозних» користувачів, які не хочуть витрачати час на завантаження непотрібної в даний момент інформації, існує інший Яндекс. Його сторінка вражає скромністю дизайну і швидкістю завантаження. Адреса цієї есенції пошукової машини - www.ya.ru.
2.3 Yahoo
Бази даних: у веденні знаходиться служба пошуку Internet-ресурсів, новин, карт, рекламних інформацій, спортивна інформація, бізнес, номери телефонів, персональні WWW-сторінки, і email-адреси (окрема база даних).
Зміст: Основна директорія містить: адреси (URLs) лля Internet-ресурсів і короткий опис для цих зв'язків.
Пошук: Всі Yahoo сторінки пропонують не тільки просте пошукове вікно, але і опції для цього пошуку, а так само пошук Usenet або Email-адреси. Пошук може обмежуватися вказівкою певного проміжку часу. Boolean оператори (і, або) і послідовний пошук також підтримані. Відзначимо: якщо пошук в Yahoo! не привів до позитивного результату, то процес пошуку автоматично переходить на Alta Vista, яка продовжує пошук, і в разі позитивних результатів автоматично повертає знайдену інформацію в Yahoo!.
Якщо Yahoo! не може встановити зв'язок досить швидко з Alta Vista, то в цьому випадку Yahoo! буде забезпечувати сторінку зв'язку з набором інструментів пошуку. Після того, як одна з цих зв'язків вибирається, ключові слова передаються до пошукової машини на ваш розсуд.
Засобом, що полегшує пошук, є наявність «tip search» (TS) - пошук за допомогою «натяку»: Yahoo! Є підлеглим довідником, що означає, що система не має так багато сторінок, як пошукові машини, однак завдання найбільш загальних ключових слів дозволить знайти необхідну тему на сторінці високого рівня (перша сторінка, яка виникає перед користувачем при відвідуванні сайту) для організації або компанії.
Результати: Зв'язки відображаються відповідно до черговості задаються слів послідовністю пошуку поряд з їх описовим текстом і підпорядкованої ієрархією.
Адреса: http://www.yahoo.com/
2.4 Altavista
AltaVista (www. AltaVista.com) - одна з найстаріших пошукових систем в Інтернеті. Перший web-індекс був представлений компанією в 1995 році. Ядро пошукової системи зобов'язано своїм народженням дивною особливості дослідницької лабораторії компанії Digital Equipment Corp. Співробітники цієї лабораторії для чогось зберігали всю свою електронну переписку за останні 10 років. Щоб ця купа інформації не просто займала дисковий простір, а приносила хоч якусь користь, була створена програма для індексування документів і пошуку потрібних слів у купі пожовклим від часу електронної кореспонденції. Система вийшла настільки вдалою, що згодом з успіхом перекочувала на простори Всесвітньої павутини.
Індекс AltaVista містить документи на більш ніж 25 мовами. Локалізовані версії сайту AltaVista розташовуються в доменах 20 країн. В область пошуку можна включити документи на всіх підтримуваних мовами або тільки в документах на певній мові, а на спеціальній сторінці можна дізнатися декілька мов для пошуку на всіх вибраних мовах одночасно.

Висновки і пропозиції
Нині у мережі Internet використовуються практично усі відомі лінії зв'язку від низькошвидкісних телефонних ліній до високошвидкісних цифрових супутникових каналів. Операційні системи, використовувані в мережі Internet, також відрізняються різноманітністю. Більшість комп'ютерів мережі Internet працюють під ОС Unix чи VMS. Широко представлені також спеціальні маршрутизатори мережі типу NetBlazer або Cisco, чия ОС нагадує ОС Unix.
Фактично Internet складається з безлічі локальних і глобальних мереж, що належать різним компаніям і підприємствам, пов'язаних між собою різними лініями зв'язку. Internet можна уявити собі у вигляді мозаїки складеної з невеликих мереж різної величини, які активно взаємодіють одна з іншою, пересилаючи файли, повідомлення й т.п.
Прикладом топології мережі Internet може бути мережу Х-Атом, що складається з декількох підмереж, і в той же час є фрагментом всесвітньої мережі Internet.
На сьогоднішній день у світі існує понад 130 мільйонів комп'ютерів і більше 80% з них об'єднані в різноманітні інформаційно-обчислювальні мережі від малих локальних мереж в офісах до глобальних мереж типу Internet. Всесвітня тенденція до об'єднання комп'ютерів у мережі обумовлена ​​поруч важливих причин, таких як прискорення передачі інформаційних повідомлень, можливість швидкого обміну інформацією між користувачами, одержання і передача повідомлень (факсів, E - Mail листів і іншого) не відходячи від робочого місця, можливість миттєвого одержання будь-якої інформації з будь-якої точки земної кулі, а так само обмін інформацією між комп'ютерами різних фірм виробників працюючих під різним програмним забезпеченням.
Такі величезні потенційні можливості які несуть у собі обчислювальна мережа і той новий потенційний підйом який при цьому відчуває інформаційний комплекс, а так само значне прискорення виробничого процесу не дають нам право не приймати це до розробки і не застосовувати їх на практиці.
Тому необхідно розробити принципове вирішення питання по організації ІТТ (інформаційно-обчислювальної мережі) на базі вже існуючого комп'ютерного парку та програмного комплексу відповідає сучасним науково-технічним вимогам з урахуванням зростаючих потреб і можливістю подальшого поступового розвитку у зв'язку з появою нових технічних і програмних рішень.
Internet продовжує розвиватися з неослабною інтенсивністю, по суті справи стираючи обмеження на поширення та отримання інформації у світі. Проте в цьому інформаційному океані буває не дуже легко знайти необхідний документ. Слід також мати на увазі, що в мережі поряд з давно діючими серверами виникають нові.
Крім серверів «спільного» призначення є спеціалізовані сайти в тій чи іншій області, як наприклад для фізики високих енергій - http://xxx.lanl.gov.
При імпортуванні файлів статей слід також мати на увазі, що часто вони зберігаються в PostScript форматі (з розширенням, PS'', EPS'') призначеному для роздрукування на лазерному принтері, тому в цьому випадку, після їх отримання для перегляду і друку на матричному принтері слід використовувати спеціальну програму, наприклад GhostView.
Не викликає сумніву, що використання Internet в науковій роботі дозволяє отримувати саму, гарячу''інформацію і підтримувати контакт з колегами в світі.
Є припущення, що Інтернет витіснить і замінить книги. Зараз цьому перешкоджає низка факторів. По-перше, відсутність комфорту при читанні книг з монітора комп'ютера. І хоча портативні пристрої для читання електронних текстів вже існує, дозвіл їх екранів явно недостатньо. По-друге, не до кінця розроблені авторські права на електронні публікації.
Інтернет в перспективі значно потіснить традиційні засоби масової інформації завдяки гнучкості, оперативності та інтерактивності.
Сьогодні безліч людей несподівано для себе відкривають для себе існування глобальних мереж, об'єднуючих комп'ютери у всьому світі в єдиний інформаційний простір, який називається Internet. Що це таке, визначити непросто. З технічної точки зору Internet - це об'єднання транснаціональних комп'ютерних мереж, що працюють по різних протоколах, пов'язують різноманітні типи комп'ютерів, фізично передають дані по всіх доступних типах ліній - від витої пари і телефонних проводів до оптоволокна і супутникових каналів. Більша частина комп'ютерів в Internet пов'язано по протоколу TCP / IP. Можна сказати, що Internet - це мережа мереж, обплутує всю земну кулю.

Список рекомендованої літератури
1. Інформатика / Курносов А.П., Кульов С.В., Улезько А.В. та ін; Під ред. А.П. Курносова.-М: Колос, 2005. - 72 с. (Підручники і навч. Посібник для студентів вищ. Навч. Закладів)
2. Практикум з інформатики: Учеб. посібник / За ред. Курносова А.П. - Воронеж: ВДАУ, 2004. -239 С.
3. Інформатика. Підручник. - 3-е изд., Перераб. / За ред. Н.В. Макарової. - М.: Фінанси і статистика, 2002. - 256 с.
4. Інформатика. Базовий курс / Симонович С.В. та ін-Спб.: Пітер, 2006. - 639 с.: Іл.
5. Крупник А.Б. Пошук в Інтернеті: самовчитель. - 2-е вид. - СПБ.: Пітер, 2004. - 572 с.
6. Орлов О.О. Потрібні програми для Інтернету - СПб.: Пітер, 2006. - 127 с.
7. Солоніцин Ю.А., Холмогоров В. Інтернет. Енциклопедія. - 3-є з. - СПб.: Пітер, 2003. - 592 с.
8. Резніков Ф.А. Швидко і легко освоюємо роботу в мережі Інтернет. - М.: Кращі книги, 2002. - 284 с.
9. Комп'ютерні мережі та засоби захисту інформації: Учеб. посібник / Камалян А.К., Кульов С.А., Назаренко К.М. та ін - Воронеж: ВДАУ, 2003. - 119 с.
10. Оліфер В.Г., Оліфер Н.А. Комп'ютерні мережі. Принципи, технології, протоколи. - СПб.: Пітер, 2002. - 672 с.: Іл.
11. Інтернет: Енциклопедія / За ред. Л. Меліхової. - 2-е вид.-СПб.; М.; Харків; Мінськ; Пітер, 2000. - 527 с.
12. Муштоватий І.Ф. Самовчитель по роботі в Інтернеті / За заг. ред. М.І. Монастирського. - 2-е вид., Доп. і перераб.-Ростов н / Д: Фенікс, 2002.-312 с.
13. Попов В. Практикум з Інтернет - технологіям: Навчальний курс / В. Попов .- СПб.; М.; Харків; Мінськ: Пітер, 2002. - 476 с.: Іл.
14. Комп'ютерні мережі та засоби захисту інформації: Навчальний посібник / Камалян А.К., Кульов С.А., Назаренко К.М. та ін-Воронеж: ВДАУ, 2003.-119 с.
15. Заїка А.А. Комп'ютерні мережі - М: Олма-Пресс, 2005. -448 С.
16. Комп'ютерні мережі: Навчальний курс - 2-е вид. (+ CD-ROM). - MicrosoftPress, Російська редакція, 1998.
17. Основи сучасних комп'ютерних технологій. Під ред. Хомоненко А.Д. - Корона-принт, СПб 1998.
18. Персональні комп'ютери в мережах TCP / IP. Крейг Хант; перекл. З англ. - BHV-Київ, 1997.
19. Федеральний закон Російської Федерації «Про інформацію, інформатизації і захисту інформації» від 20.02.1995 № 24-ФЗ.
20. Комер Д. Принципи функціонування Інтернету: Пер. з англ. / Д. Комер. - СПБ.; М.; Харків; Мінськ: Пітер, 2002.-379 с.
Додати в блог або на сайт

Цей текст може містити помилки.

Програмування, комп'ютери, інформатика і кібернетика | Курсова
80.4кб. | скачати


Схожі роботи:
Технологія зберігання пошуку і сортування інформації
Методи пошуку інформації в мережі інтернет Інформаційно-пошукові системи
Мережі Internet і Intranet
Розвиток глобальної мережі Internet
Інтелектуальна власність в мережі Internet
Формування маркетингу в мережі Internet
Методи та способи підключення до мережі Internet
Робота в комп ютерній мережі INTERNET
Зчитування інформаії з мережі Internet за допомогою HTTP
© Усі права захищені
написати до нас