Ім'я файлу: информатика_ТОР70.pdf
Розширення: pdf
Розмір: 343кб.
Дата: 03.11.2022
скачати

Тема 2.2. «Основные информационные процессы и их реализация с помощью
компьютеров: обработка, хранение, поиск, и передача информации»
Основные информационные процессы и их реализация с помощью компьютеров:
обработка, хранение, поиск и передача информации»
План
1. поиск информации
2. обработка информации
3. хранение информации
4. архивы
5. контрольные вопросы
1.
Поиск информации
Приходится признать, что органы чувств — наш главный инструмент познания мира — не самые совершенные приспособления. Не всегда они точны и не всякую информацию способны воспринять. Не случайно о грубых, приблизительных вычислениях говорят: «на глаз». Если бы не было специальных приборов, то вряд ли человечеству удалось бы проникнуть в тайны живой клетки или отправить к Марсу и
Венере космические зонды.
Вся деятельность человека связана с различными действиями с информацией, и помогают ему в этом разнообразные технические устройства.
Одно из древнейших сооружений, используемое для получения астрономической информации, находится в Англии недалеко от города Солсбери. Это Стоунхендж —
«висячие камни». Он был построен примерно во II веке до н. э. Стоунхендж состоит из поставленных вертикально каменных столбов, расположенных концентрическими кольцами. На вертикальных камнях лежат горизонтальные перекладины, своего рода арки.
1963 году с помощью новейших методов исследования было уставлено, что каменные арки дают направления на крайние положения Солнца и Луны, а 56 белых лунок помогают предсказать время Солнечного и Лунного затмений.
Одно из древнейших устройств — весы. С их помощью люди получают информацию о массе объекта. Еще один наш старый знакомый — термометр — служит для измерения температуры окружающей его среды.
Поиск
Поиск информации - это извлечение хранимой информации.
какие методы поиска вы знаете? Методы поиска информации:
• непосредственное наблюдение;
• общение со специалистами по интересующему вас вопросу;
• чтение соответствующей литературы;
• просмотр видео, телепрограмм;
• прослушивание радиопередач, аудиокассет;
• работа в библиотеках и архивах;
• запрос к информационным системам, базам и банкам компьютерных данных;
2.
Обработка информации
В приведенных ниже примерах каждый следующий элемент получен по некоторому правилу. Угадайте это правило.
1.
Победа, обеда, беда, еда,...(Ответ. Отбрасывание первой буквы слова.)
2.
1, 1, 2, 3, 5, 8, 13, ... (Ответ. Каждое число, начиная с третьего, равно сумме двух предыдущих (числа Фибоначчи).)
? Какой информационный процесс был реализован вами в ходе решения заданий?
- обработка
Рассмотрим ещё примеры обработки информации человеком.
Примеры обработки информации
Ученик решает задачу.

Калькулятор производит вычисления.
Художник рисует портрет.
Что общего можно заметить во всех приведённых примерах?
В процессе обработки информации присутствуют три составляющие:
Входная информация
Правило
Выходная информация
Какое определение обработки информации можно дать?
Обработка информации – преобразование информации из одного вида в другой,
осуществляемое по строгим формальным правилам
Обрабатывать можно информацию любого вида. Правила обработки могут быть самыми разнообразными.
Системы, в которых наблюдателю доступны лишь входные и выходные
величины, а структура и внутренние процессы неизвестны, называют черным
ящиком.
как человек обрабатывает информацию?
-думает, осуществляется процесс мышления. как компьютер обрабатывает информацию?
- в состав ПК входит устройство обработки информации – процессор.
?какие программы используются нами для обработки информации на ПК?
- прикладные
Обработка информации на ПК
Вид информации
(по способу представления)
Прикладная программа
Текстовая
Текстовый процессор WORD, …
Числовая
Табличный процессор Excel, …
Графическая
Растровый графический редактор PAINT, …
Созданную и полученную информацию необходимо хранить.
Что вы знаете о процессе хранения информации?
3.
Хранение информации
Хранение информации – процесс такой же древний, как и жизнь человеческой цивилизации. Уже в древности человек столкнулся с необходимостью хранения информации: зарубки на деревьях, чтобы не заблудиться во время охоты; счет предметов с помощью камешков, узелков; изображение животных и эпизодов охоты на стенах пещер.
В жизни человека процесс длительного хранения информации играет большую роль и подвергается постоянному совершенствованию.
? Какое определение хранения информации можно дать?
Хранение информации – это способ распространения информации в
пространстве и времени.
как человек хранит информацию?
- запоминает, записывает. как компьютер хранит информацию?
- в состав ПК входит устройство хранения информации – жёсткий диск.
- существует так называемая внешняя память компьютера – цифровые носители информации.
Носитель информации – физическая среда, непосредственно хранящая
информацию. Основным носителем информации для человека является его собственная биологическая память (мозг человека). Собственную память человека можно назвать оперативной памятью. Здесь слово “оперативный” является синонимом слова “быстрый”.
Заученные знания воспроизводятся человеком мгновенно. Собственную память мы еще можем назвать внутренней памятью, поскольку ее носитель – мозг – находится внутри нас.

Носитель информации — строго определённая часть конкретной
информационной системы, служащая для промежуточного хранения или передачи
информации.
Что является основными хранилищами информации для человека, для общества?
Основные хранилища информации
Для человека
Для общества
Память
Библиотеки, видеотеки, фонотеки, архивы, патентные бюро, музеи, картинные галереи
Хранение информации на ПК
Информационная система – это хранилище информации, снабженное
процедурами ввода, поиска и размещения и выдачи информации
Компьютерные хранилища
Программа
Базы данных
Система управления базами данных Access, …
Информационно-поисковые
системы
Yandex, Google, …
Электронные энциклопедии
Википедия, Большая энциклопедия Кирилла и Мефодия,

Медиатеки
Школьная медиатека, …
Хранение информации на внешних носителях.
? какие внешние носители существуют?
Хранение очень больших объемов информации оправдано только при условии, если поиск нужной информации можно осуществить достаточно быстро, а сведения получить в доступной форме.
Магнитная лента — носитель магнитной записи, представляющий собой тонкую гибкую ленту, состоящую из основы и магнитного рабочего слоя. Рабочие свойства магнитной ленты характеризуются её чувствительностью при записи и искажениями сигнала в процессе записи и воспроизведения. Наиболее широко применяется многослойная магнитная лента с рабочим слоем из игольчатых частиц магнитно-твёрдых порошков гамма-окиси железа (у-Fе2О3), двуокиси хрома (СrО2) и гамма-окиси железа, модифицированной кобальтом, ориентированных обычно в направлении намагничивания при записи. где используются магнитные ленты?
Дисковые носители информации относятся к машинным носителям с прямым доступом. Понятие прямой доступ означает, что ПК может «обратиться» к дорожке, на которой начинается участок с искомой информацией или куда нужно записать новую информацию.
Накопители на дисках наиболее разнообразны:
Накопители на гибких магнитных дисках (НГМД), они же флоппи-диски, они же дискеты
Некоторое время назад дискеты были самым популярным средством передачи информации с компьютера на компьютер, так как интернет в те времена был большой редкостью, компьютерные сети тоже, а устройства для чтения-записи компакт дисков стоили очень дорого. Дискеты и сейчас используются, но уже достаточно редко. В основном для хранения различных ключей (например, при работе с системой клиент-банк) и для передачи различной отчетной информации государственным надзорным службам.
Дискета — портативный магнитный носитель информации, используемый для многократной записи и хранения данных сравнительно небольшого объема. Этот вид носителя был особенно распространён в 1970-х — начале 2000-х годов. Вместо термина
«дискета» иногда используется аббревиатура ГМД — «гибкий магнитный диск»
(соответственно, устройство для работы с дискетами называется НГМД — «накопитель на гибких магнитных дисках», жаргонный вариант — флоповод, флопик, флопарь от
английского floppy-disk или вообще "печенюшка"). Обычно дискета представляет собой гибкую пластиковую пластинку, покрытую ферромагнитным слоем, отсюда английское название «floppy disk» («гибкий диск»). Эта пластинка помещается в пластмассовый корпус, защищающий магнитный слой от физических повреждений. Оболочка бывает гибкой или прочной. Запись и считывание дискет осуществляется с помощью специального устройства — дисковод (флоппи-дисковод). Дискета обычно имеет функцию защиты от записи, посредством которой можно предоставить доступ к данным только в режиме чтения. Внешний вид 3,5”.
? какой размер дискеты? 1.44мб, но есть и 720кб.
Накопители на оптических компакт-дисках:
Компакт-диск («CD», «Shape CD», «CD-ROM», «КД ПЗУ») — оптический носитель информации в виде диска с отверстием в центре, информация с которого считывается с помощью лазера. Изначально компакт-диск был создан для цифрового хранения аудио (т. н. Audio-CD), однако в настоящее время широко используется как устройство хранения данных широкого назначения (т. н. CD-ROM). Аудио-компакт-диски по формату отличаются от компакт-дисков с данными, и CD-плееры обычно могут воспроизводить только их (на компьютере, конечно, можно прочитать оба вида дисков). Встречаются диски, содержащие как аудиоинформацию, так и данные — их можно и послушать на CD- плеере, и прочитать на компьютере.
Оптические диски имеют обычно поликарбонатную или стеклянную термообработанную основу. Рабочий слой оптических дисков изготавливают в виде тончайших плёнок легкоплавких металлов (теллур) или сплавов (теллур-селен, теллур- углерод, теллур-селен-свинец и др.), органических красителей. Информационная поверхность оптических дисков покрыта миллиметровым слоем прочного прозрачного пластика (поликарбоната). В процессе записи и воспроизведения на оптических дисках роль преобразователя сигналов выполняет лазерный луч, сфокусированный на рабочем слое диска в пятно диаметром около 1 мкм. При вращении диска лазерный луч следует вдоль дорожки диска, ширина которой также близка к 1 мкм. Возможность фокусировки луча в пятно малого размера позволяет формировать на диске метки площадью 1-3 мкм. В качестве источника света используются лазеры (аргоновые, гелий-кадмиевые и др.). В результате плотность записи оказывается на несколько порядков выше предела, обеспечиваемого магнитным способом записи. Информационная ёмкость оптического диска достигает 1 Гбайт (при диаметре диска 130 мм) и 2-4 Гбайт (при диаметре 300 мм).
Широкое применение в качестве носителя информации получили также магнитооптические компакт-диски типа RW (Re Writeble). На них запись информации осуществляется магнитной головкой с одновременным использованием лазерного луча.
Лазерный луч нагревает точку на диске, а электромагнит изменяет магнитную ориентацию этой точки. Считывание же производится лазерным лучом меньшей мощности.
Во второй половине 1990-х годов появились новые, весьма перспективные носители документированной информации - цифровые универсальные видеодиски DVD
(Digital Versatile Disk) типа DVD-ROM, DVD-RAM, DVD-R с большой ёмкостью (до 17
Гбайт).
Имеются и другие разновидности дисковых носителей информации, например, магнитооптические диски, но ввиду их малой распространенности мы их рассматривать не будем.
4.
Архивы.
Многие помнят то время, когда жесткий диск (винчестер) был размером несколько десятков мегабайт, именно мегабайт, тогда как на сегодняшний день винт имеет размеры в несколько сотен гигабайт и даже есть терабайты.
В том, что, увеличивая объемы винчестеров, мы тем самым увеличиваем и размеры программ, которые мы создаем. На данный момент, на современных винтах можно
хранить огромную информацию: много часов прослушивания музыкальных произведений, сотни фильмов, всевозможные компьютерные игры, программы и так далее.
Поэтому вопрос об архивировании данных и сжатия файлов остается таким же актуальным, когда он был актуальным и в 10 лет, и 20 лет назад.
? Почему необходимо запаковать файлы в архив? Да потому, что в один файл можно поместить несколько файлов и архивы на диске занимают места намного меньше.
? Что же такое архивирование данных и сжатие файлов?
Если привести грубую аналогию, то архивирование данных похоже на производство сухого молока - процесс удаления воды из молока, которую можно затем добавить при необходимости. Данные же имеют воду информационную, в файлах встречаются очень много повторов, это и используют для сжатия данных.
архивирование данных - это процесс сжатия файлов, с целью освобождения
места на диске.
Особенно хорошо сжимаются тестовые файлы, если повторов очень много, то сжатия можно добиться до 10 раз. Хуже сжимаются цветные графические файлы. Можно сказать, что в среднем архиваторы дают выигрыш в 2-3 раза.
Программа, которая сжимает текстовый файл, называется упаковщиком или
архиватором. Программы-упаковщики архивируют не только текстовые файлы, а также программы, звуковые, графические, видеофайлы и другие.
В процессе архивирования данных создается архивный файл, который меньше по объему сжимаемых файлов. После создания архива, сжимаемые файлы можно удалить, тем самым освобождая место на диске.
Если же вам снова понадобилось вернуть архивные файлы в первоначальное состояние, то можно распаковать архив, вернув тем самым файлы на прежнее место.
Архив при этом можно удалить, чтобы просто не занимал лишнего места на диске.
Существует достаточное количество архиваторов и столько же типов архивных файлов. Среди них самыми распространенными являются ZIP и RAR.
Если у вас нет на компьютере никакого архиватора, то можно воспользоваться встроенным архиватором Windows, который отвечает за работу с zip-архивами.
Встроенный архиватор Windows не может защитить архив паролем, не может создавать самораспаковывающийся архив, не сможет большой архив порезать на части, чтобы разместить на дискетах или компакт-дисках.
Поэтому, если вы хотите избавить себя от этих ограничений, то вам нужно установить на вашем компьютере отдельную программу-архиватор.
? какие архиваторы вы знаете?
7-ZIP - отличный архиватор - автор Игорь Павлов. Может создавать архивы, используемые в других операционных системах и извлекать файлы из всех архивных форматов.
WinRAR - один из лучших в мире архиваторов - автор Евгений Рошал. Умеет создавать архивы как RAR та и ZIP.
? что такое самораспаковывающийся архив?
Самораспаковывающийся архив - это архив, который распаковывается без
всякого архиватора, то есть самостоятельно и его имя кончается на .ехе.
Такой архив можно создать, воспользовавшись окном программы WinRAR, либо используя контекстное меню архивируемого объекта.
Кроме того архиватор может сделать еще много полезных вещей, например, вы можете в RAR создать ZIP-архив, хотя RAR-архивы получаются меньшего размера, закрыть доступ к данным вашего архива, защитив его паролем, и многое другое.
5.
Контрольные вопросы
1. Что такое поиск информации?
2. Как осуществляется хранение информации в данный момент?

3. что затрагивает информационный процесс обработка информации?
4. какие внешние носители вам известны?
5. что такое внешний носитель с прямым доступом?
6. для чего необходимы архивы?
7. что такое самораспаковывающийся архив?
Тема 2.3. Поиск информации с использованием компьютера. Программные
поисковые сервисы.
План
1. Поиск информации.
2. Информационно-поисковые системы.
3. Поисковые технологии информационных систем.
4. Контрольные вопросы.
1. Поиск информации
Поиск информации или информационный поиск представляет один из основных информационных процессов. Человечество издревле занималось им. Цели, возможности и характер поиска всегда зависели от наличия, информации, её важности и доступности, а также средств организации поиска.
Конец XX - начало XXI века, характеризуется огромными массивами постоянно растущей разнообразной информации, доступной и представляющей интерес для самых широких слоев социума. Более того, Интернет-технологии и программно-технические средства, также доступные большинству людей, позволяют осуществлять данный процесс в любое время, практически в любом месте по любым запросам.
Поиск - процесс, в ходе которого в той или иной последовательности производится соотнесение отыскиваемого с каждым объектом, хранящимся в массиве. Цель любого поиска заключается в потребности, необходимости или желании находить различные виды информации, способствующие получению лицом, осуществляющим поиск, нужных ему сведений, знаний и т.д. для повышения собственного профессионального, культурного и любого иного уровня; создания новой информации и формирования новых знаний; принятия управленческих решений и т.п.
По оценке специалистов в Интернете работает 30 и более миллионов пользователей. Из них десятки тысяч - в режиме онлайн (англ. "on-line" - интерактивный доступ в любой момент времени) и количество таких пользователей постоянно растет. Это затрудняет организацию оперативного поиска и нахождения нужной такому количеству пользователей информации. Возникают проблемы, обусловленные разнообразными возможностями (видами) поиска информации, различными способами их реализации в информационно-поисковых системах (ИПС), разным уровнем знаний пользователей о возможностях таких систем, особенно в области формирования запросов и обработки данных, полученных в результате выполнения этих запросов и т.д.
Предполагается, что в дальнейшем будут созданы ИПС, способные автоматически адаптироваться с учетом уровня знаний и запросов конкретных пользователей, воспринимать запросы на естественном языке и, используя искусственный интеллект, выдавать им релевантную и пертинентную информацию. Для создания таких ИПС потребуются интеллект и знания конкретных пользователей ИПС или их посредников.
Пока же от широкого круга пользователей поисковых систем требуется достаточно хорошо владеть данной предметной областью.
Существуют различные толкования термина "поиск информации" или "информационный поиск".

Термин "информационный поиск" (англ. "information retrieval") ввёл американский математик К. Муэрс. Он заметил, что побудительной причиной такого поиска является информационная потребность, выраженная в форме информационного запроса. К объектам информационного поиска К. Муэрс отнес документы, сведения об их наличии и
(или) местонахождении, фактографическую информацию.
Решать проблемы фактографического поиска первыми стали представители библиотек. Они разработали средства информационного поиска, получившие название "справочно-поисковый аппарат" (каталоги, библиографические указатели и др.). В профессиональной отечественной печати данный термин используется с 1970-х годов.
Библиотекари определяют "информационный поиск" как нахождение в информационном массиве документов, соответствующих информационному запросу пользователей.
С точки зрения использования компьютерной техники "информационный поиск" - совокупность логических и технических операций, имеющих конечной целью нахождение документов, сведений о них, фактов, данных, релевантных запросу потребителя.
"Релевантность" - устанавливаемое при информационном поиске соответствие содержания документа информационному запросу или поискового образа документа поисковому предписанию.
Существуют и другие определения. В любом случае, информационный поиск вызван потребностью удовлетворения информационных запросов пользователей, ожидающих с помощью поисковых систем оперативно получить необходимые им данные или сведения. Он является методом нацеленного поиска и извлечения релевантных документов и (или) фактов из различных источников информации, например, банков данных или запоминающих устройств. В качестве таковых выступают живые и неживые объекты, представляющие различные источники и носители информации.
Системы, обеспечивающие реализацию подобного поиска информации, называются поисковыми системами (ПС). В традиционных технологиях ПС представляют картотеки и каталоги, адресные и иные справочники, указатели, энциклопедии, справочный аппарат к изданиям и другие материалы.
В 1945 годы американский ученый и инженер В. Буш в статье "Возможный механизм нашего мышления" впервые широко поставил вопрос о необходимости механизации информационного поиска. Начиная с 1960 годов, появляются автоматизированные поисковые системы, работающие с информацией. С этого периода ведутся интенсивные работы в области формирования и реализации принципов и методов информационного поиска.
"Поисковые системы" осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова.
Электронные ПС с помощью обычных или интеллектуальных терминалов (ПЭВМ) дают возможность пользователям производить поисковые запросы при помощи формальных и описывающих содержание элементов и с применением специальных логических операторов; осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова. Поисковые системы позволяют осуществлять только поисковые процедуры и связанные с ними процессы.
2. Информационно-поисковые системы
ПС с большим набором функций и возможностей обычно входят в состав СУБД и именуются информационно-поисковыми системами. Они также создаются и используются для эффективного нахождения пользователями необходимых им данных, в том числе в Интернете.
Терминологически "информационно-поисковая система" (англ. "information retrieval system", IRS) - представляет систему, предназначенную для поиска и хранения информации; пакет программного обеспечения, реализующий процессы создания, актуализации, хранения и поиска в информационных базах и банках данных.

Информационно-поисковая система трактуется и как система, обеспечивающая поиск и отбор необходимых данных на основе информационно-поискового языка и соответствующих правил поиска, а база данных - как совокупность средств и методов описания, хранения и манипулирования данными, облегчающих сбор, накопление и обработку больших информационных массивов. Организация различных БД отличается видом объектов данных и отношений между ними.
Функционирование современных ИПС основано на двух предположениях:
1) документы, необходимые пользователю, объединены наличием некоторого признака или комбинации признаков;
2) пользователь способен указать этот признак.
Оба эти предположения на практике не выполняются, и можно говорить только о вероятности их выполнения. Поэтому, процесс поиска информации обычно представляет собой последовательность шагов, приводящих при посредстве системы к некоторому результату, и позволяющих оценить его полноту. При этом поведение пользователя, как организующее начало управления процессом поиска, мотивируется не только информационной потребностью, но и разнообразием стратегий, технологий и средств, предоставляемых системой.
Пользователь обычно не имеет исчерпывающих знаний об информационном содержании ресурса, в котором проводит поиск. Оценить адекватность выражения запроса, как и полноту получаемого результата, он может, отыскав дополнительные сведения, или так организовав процесс, чтобы часть результатов поиска могла использоваться для подтверждения или отрицания адекватности другой части. В то же время, для пользователей-профессионалов характерна устойчивость тематического профиля. Когда они являются "информационно-ориентированными", то им свойственно желание и способность организовать информационное пространство проблемы. Это означает, что пользователь создаёт по существу новый, "самостоятельный" проблемно- ориентированный, индивидуально обновляемый и пополняемый ИР, включающий помимо подборок документов также и метаинформацию, например, словари специальной терминологии, классификаторы предметных областей, описания ресурсов и т.д.
Особенность работы пользователя в режиме "самообслуживания", в контексте задачи автоматизации совокупной деятельности, означает, что система должна представлять среду, обеспечивающую поддержку функций потребителя по обработке найденной информации, а также традиционно относящихся к функциям информационного посредника (интерпретация запроса, его перевод на информационно- поисковый язык, выбор ИР, автоматизированный поиск и ручной отбор материалов), но также и такие "обеспечивающие" функции, как: структурирование информационной потребности, лексическая адаптация запроса, оценка, систематизация и обработка результатов поиска, причём на уровне как отдельного документа, так и информационных ресурсов в целом. Технические возможности, которыми располагает пользователь, позволяют ему создавать информационный ресурс - формировать массивы, систематизировать и создавать внешние представления их содержания для собственного или внешнего использования.
ИПС делятся на: традиционные (ручные, механические, электромеханические) и автоматизированные (электронные).
Автоматизированные ИПС (АИПС), используют компьютерные программно- технические средства и технологии и предназначаются для нахождения и выдачи пользователям информации по заданным критериям. Определяющими для понимания методов автоматизации поиска являются два следующих фактора:
1) сравниваются не сами объекты, а описания - так называемые "поисковые образы";
2) сам процесс является сложным (составным и не одноактным) и обычно реализуется последовательностью операций.

Данные в АИПС вводятся на основе специально разрабатываемых форматов ввода.
Все сведения об одном объекте в ИПС представляются в виде систематизированных данных, образующих одну строку таблицы и называются записью. При этом, если ИПС представляет электронный каталог библиотеки, то любое библиографическое описание
(БО) документа в нём - это одна запись, состоящая из полей, равных количеству элементов БО. Совокупность записей образует БД, которая, как правило, хранится в одном файле. Совокупность БД, объединенных одной СУБД, образует банк данных.
Поскольку АИПС инструмент, используемый человеком при поиске (а не интеллектуальным автомат для поиска информации - готовых решений задач основной деятельности), эффективность её использования зависит от того, насколько хорошо человек знает природу операционных объектов и свойства инструмента, посредством которого он работает с этими объектами.
Информационный поиск подразумевает использование определённых стратегий, методов, механизмов и средств. Поведение пользователя, осуществляющего управление процессом поиска, определяется не только информационной потребностью, но и инструментальным разнообразием системы
- технологиями и средствами, предоставляемыми системой.
Стратегия поиска - общий план (концепция, предпочтение, установка) поведения системы или пользователя для выражения и удовлетворения информационной потребности пользователя, обусловленный как характером цели и видом поиска, так и системными "стратегическими" решениями - архитектурой БД, методами и средствами поиска в конкретной АИПС. Выбор стратегии в общем случае является оптимизационной задачей. На практике в значительной степени он определяется искусством достижения компромисса между практическими потребностями и возможностями имеющихся средств.
Метод поиска - совокупность моделей и алгоритмов реализации отдельных технологических этапов: построения поискового образа запроса (ПОЗ), отбора документов
(сопоставление поисковых образов запросов и документов), расширения и реформулирования запроса, локализации и оценки выдачи.
Поисковый образ запроса - записанный на ИПЯ текст, выражающий смысловое содержание информационного запроса и содержащий указания, необходимые для наиболее эффективного осуществления информационного поиска.
Методы поиска, т.е. выделение подмножества документов, потенциально содержащих описание решения задачи отбора документов (ОД), являются отражением процесса нахождения решения и зависят от характера задачи и предметной области.
Рассматривая поиск как итеративный процесс, методы сокращения пространства перебора (просматриваемого подмножества) образуют по существу методологическую основу стратегии поиска и могут быть разделены на следующие классы - методы поиска в:
1) одном пространстве (обычно, тематическом);
2) иерархически упорядоченном пространстве;
3) альтернативных пространствах;
4) динамическом (изменяющемся в процессе поиска) пространстве.
Реализуемый метод построения ПОЗа должен обеспечивать эффективные способы построения запроса для достижения целей различного типа.
Механизмы поиска - совокупность реализованных в системе моделей и алгоритмов процесса формирования выдачи документов в ответ на поисковый запрос.
Средства поиска, с одной стороны, - взаимозависимый комплекс информационно- поисковых языков (ИПЯ) и языков определения/управления данными, обеспечивающий структурные и семантические преобразования объектов обработки (документов, словарей, совокупностей результатов поиска), а с другой, - объекты пользовательского интерфейса, обеспечивающие управление последовательностью выбора операционных объектов конкретной АИПС.

Поисковые технологии - унифицированные (оптимизированные в рамках конкретной АИПС) последовательности эффективного использования отдельных средств поиска в процессе взаимодействия пользователя с системой для устойчивого получения конечного и промежуточных результатов.
Навигация как реализация процесса поиска по запросу в выбранной БД - целенаправленная, определяемая стратегией, последовательность использования методов, средств и технологий конкретной АИПС для получения и оценки результата.
Средства навигации позволяют пользователю осуществлять управление процессом поиска. Они предоставляются пользователю в виде интерфейса, позволяющего организовать более или менее эффективный процесс взаимодействия с БД. При этом "дружественность" интерфейса характеризуется не только эргономичностью и понятностью, но и вариантностью выбора операционных объектов.
Процесс поиска информации представляет последовательность шагов, приводящих при посредстве системы к некоторому результату, и позволяющих оценить его полноту.
Так как пользователь обычно не имеет исчерпывающих знаний об информационном содержании ресурса, в котором проводит поиск, то оценить адекватность выражения запроса, равно как и полноту получаемого результата, он может, основываясь лишь на внешних оценках или на промежуточных результатах и обобщениях, сопоставляя их, например, с предыдущими.
Процесс поиска можно представить в виде следующих основных компонент:
1) формулирование запроса на естественном языке, выбор поисковых системы и сервисов, формализация запроса на соответствующем ИПЯ;
2) проведение поиска в одной или нескольких поисковых системах;
3) обзор полученных результатов (ссылок);
4) предварительная обработка полученных результатов: просмотр содержания ссылок, извлечение и сохранение релевантных и пертинентных данных;
5) при необходимости, модификация запроса и проведение повторного
(уточняющего) поиска с последующей обработкой полученных результатов.
Для уменьшения объёма отобранных материалов осуществляют фильтрацию результатов поиска по типу источников (сайтов, порталов), тематике и другим основаниям.
3. Поисковые технологии информационных систем
По используемым поисковым технологиям ИС можно разбить на 4 категории:
1. Тематические каталоги;
2. Специализированные каталоги (онлайновые справочники);
3. Поисковые машины (полнотекстовый поиск);
4. Средства метапоиска.
В Интернете ИПС размещается на одном или нескольких серверах. В ИПС собирается, индексируется и регистрируется информация о документах, имеющихся в обслуживаемой системой группе веб-серверов. В документах индексируются все значащие слова или только слова из заголовков.
Тематические каталоги предусматривают обработку документов и отнесение их к одной из нескольких категорий, перечень которых заранее задан. Фактически это индексирование на основе классификации. Индексирование может проводиться автоматически или вручную с помощью специалистов, просматривающих популярные веб-узлы и составляющих краткое описание документов-резюме (ключевые слова, аннотация, реферат).
Специализированные каталоги или справочники создаются по отдельным отраслям и темам, по новостям, по городам, по адресам электронной почты и т. п.
Поисковые машины (самое развитое средство поиска в Интернете) реализуют технологию полнотекстового поиска. Индексируются тексты, расположенные на опрашиваемых серверах. Индекс может содержать информацию о нескольких миллионах
документов. Например, в индексе популярной ИПС "AltaVista" более 56 млн. URL- адресов.
При использовании средств метапоиска запрос осуществляется одновременно несколькими поисковыми системами. Результат поиска объединяется в общий, упорядоченный по степени релевантности список. Каждая система обрабатывает только часть узлов сети, что позволяет расширить базу поиска. К подобному классу можно отнести и "персональные программы поиска", позволяющие формировать свои собственные инструменты метапоиска (например, автоматически опрашивать часто посещаемые узлы).
Базы информационных данных могут содержать практически любые виды информации, в том числе в любой комбинации. Информационный поиск осуществляется как по существующим в полнотекстовых ЭИР терминам, так и по специальным элементам, входящим в состав ИПЯ. Для формирования запросов используются специальные информационно-поисковые языки.
ИПС внутри найденной выборки обычно пытаются расположить документы в порядке их "релевантности", то есть близости к введенному пользователем запросу.
Критериев такой близости много и выявление близких "по смыслу" к запросу документов не решает проблемы получения информации при отсутствии релевантного документа.
Подобная ситуация достаточно тривиальна, в том числе и потому, что пользователь зачастую ищет документ, который сам собирается написать. Следует отметить, что в результате проведенного поиска пользователь может получить как релевантные, пертинентные, так и нерелевантные и непертинентные подмассивы данных.
ИПС фактически являются системами информационного обеспечения и представляют собой базы и банки данных. В качестве объекта в них выступает индивид, организация, отрасль, регион и т.п. Субъектом информационного обеспечения является специалист-информатик, любой потребитель информации.
4. Контрольные вопросы
1. Поиск информации, что это?
2. Какие поисковые технологии информационных систем Вам известны?
3. Что такое тематические каталоги?
4. что могут содержать базы информационных технологий?

скачати

© Усі права захищені
написати до нас