Общие сведения - Web-индексы
"Всемирная паутина" в Internet - это миллионы документов с неструктурированной текстовой информацией (а также с графикой, аудио, видео). Чтобы найти нужную информацию, клиенту Сети зачастую приходится перебирать сотни страниц Web (иногда без особого успеха), тратить много сил и нервов (а также денежных средств).
С начала 90-х годов интенсивно развиваются справочные службы Internet, помогающие пользователям найти нужную информацию, и эти службы можно разделить на две категории: универсальные и специализированные.
В универсальных службах используется обычный принцип поиска в неструктурированных документах - по ключевым словам, в специализированных - по контексту.
Ключевым словом документа называется отдельное слово или словосочетание, которое каким-то образом отражает содержание данного документа, выделяет область его поиска. Ключевые слова записываются с помощью специального языка управления запросами, например: "Бразилия + футбол + чемпионат".
Универсальная служба поиска (поисковая система) - это комплекс программ и мощных компьютеров, выполняющий следующие функции:
- 1. Специальная программа (поисковый робот, паук, spider, crawler, bot) непрерывно просматривает страницы WWW, выбирает ключевые слова и составляет базу данных индексов. В эту базу включаются ключевые слова и адреса документов, в которых эти слова обнаружены (напомним, что индекс - это упорядоченный по ключевым словам набор указателей). Паук возвращается к узлу на регулярной основе, примерно каждый месяц или чаще, чтобы поискать изменения. 2. Web-сервер принимает от пользователя запрос на поиск, преобразует его и передает специальной программе - поисковой машине. 3. Поисковая машина просматривает базу данных индексов, составляет список страниц, удовлетворяющих условиям запроса (точнее, список ссылок на эти страницы) и возвращает его Web-серверу. 4. Web-сервер оформляет результаты выполнения запроса в удобном для пользователя виде и передает их на машину клиента.
Среди наиболее известных и мощных поисковых систем: Alta Vista (www. altavista. com), Infoseek (www. infoseek. com), Lycos (www. lycos. com), российская система Рамблер (www. rambler. ru) и другие.
Специализированные справочные службы (классификаторы) - это тематические каталоги (subject catalogs), в которых собраны более или менее структурированные сведения об адресах серверов по той или иной тематике. В отличие от универсальных баз индексов, тематические каталоги составляются специалистами и обеспечивают клиента более строгой, достоверной и систематизированной информацией о Сети. В классификаторах используется иерархическая (древовидная) организация информации. Это дает пользователю возможность вести просмотр, перемещаясь по иерархии тематических рубрик, и, постепенно сужая поле поиска до необходимых размеров.
Кроме того, многие сайты Internet располагают собственными механизмами поиска (в пределах данного сайта). В первую очередь это механизм контекстного поиска, а также специализированный поиск по фамилиям (например, персоны компьютерного бизнеса), товарам (на рекламных сайтах), фирмам и т. д. Некоторые полезные адреса конкретных информационных ресурсов приведены в следующей талице.
С точки зрения методологии стратегия работы современных поисковых серверов базируется на трех основных подходах:
- * создание Web-индексов (Web indexes), - алгоритм работы таких систем мы только что рассмотрели, * создание каталогов (Web directories), * "гибридный" метод, сочетающий в той или иной степени два первых подхода.
Кроме того, существует ряд дополнительных подходов к классификации информации: онлайновые справочники, системы на CD-ROM, различные желтые и белые страницы Internet и т. д. В Internet можно найти множество документов по вопросу классификации систем поиска, см. например, достаточно подробную статью на Www. josts. net/lusd/sewk. htm.
Все названные вопросы требуют дальнейшего рассмотрения и изучения, что является целью данной работы.
Похожие статьи
-
Общие сведения Данное программное средство должно помочь в расчете коммунальных услуг, упростить ввод данных о квартиросъемщике и ЖЭС, осуществлять...
-
Поиск с помощью тематических каталогов (web-каталогов) - Web-индексы
Один из способов работы с тематическим каталогом - воспользоваться иерархическим деревом при поиске информации. Т. е. вы выбираете сначала общую...
-
Общие сведения о программном продукте Разработанный программный продукт называется "Информационная система Вуза". Он направлен на решение широкого ряда...
-
Аннотация, Общие сведения и назначение пакета Simulink - Среда визуального моделирования Simulink
В работе представлено общее описание, исторические сведения, "конкуренты" пакета визуального моделирования Simulink компании MathWorks. Приведены...
-
Наименование программы Полное наименование программы - Модуль ипотечного кредитования банковской информационной системы "БИС". Краткое наименование...
-
Наименование и область применения Наименование: Автоматизированная информационная система "Отель" в дальнейшем именуемая АИС "Отель". Область применения:...
-
Общие сведения о распределенных вычислениях Обычно под Распределенными вычислениями понимают область знаний, изучающую организацию Распределенных систем...
-
Программа "Экранная лупа" облегчает работу с экраном пользователям с нарушениями зрения. Она выводит отдельное окно, в котором отображается увеличенная...
-
Техническое задание разработано в соответствии с ГОСТ 34.602-89 "Информационная технология. Комплекс стандартов на автоматизированные системы....
-
Общие сведения о работе системы Название Проекта: Информационная система учета службы горючих и смазочных материалов войсковой части Программное...
-
Техническое задание, Общие сведения - Автоматизация теплицы
Общие сведения Настоящее техническое задание разработано согласно ГОСТ 34.602-89 "Информационная технология. Техническое задание на создание...
-
Общие сведения о библиотеке GridMD Библиотека GridMD является инструментом разработчика распределенных приложений [8][9][10]. Приложение, разделяемое на...
-
Общие сведения о программе Программа разработана для демонстрации возможностей языка C++ и может использоваться для пользователей, которые не знакомы с...
-
В связи с увеличением числа сотрудников, работающих в компании, а также с расширением рабочего проекта, возникла проблема, связанная с версионностью...
-
Данный курсовой проект посвящен разработке модели программно-аппаратной защиты информации на предприятии. Проблема защиты информации на предприятии...
-
Введение, Общие сведения о локальных сетях - Разработка локальной сети для ОАО "Корпорация Монстров"
Общие сведения о локальных сетях Локальный сеть вычислительный сервер Локальная Сеть (локальная вычислительная сеть, ЛВС) - это комплекс оборудования и...
-
Служебная программа архивации помогает создать копию данных на жестком диске. Если исходные данные будут случайно удалены, заменены или станут...
-
Общие сведения о тестировании Данный раздел посвящен проведению тестирования клиентского приложения. Тестирование для серверной части системы не...
-
Общие сведения о панели управления - Операционная система Windows
Панель управления содержит средства настройки, предназначенные для изменения внешнего вида и характеристик различных компонентов Windows. Некоторые из...
-
Общие требования Прежде чем начинать формулировать требования к пользовательскому интерфейсу, было принято решение, что необходимо ознакомиться с...
-
Чтобы успешно работать с Windows XP, необходимо овладеть основными приемами работы с системой. После освоения основных понятий и принципов работы систем,...
-
Обеспечение безопасности БД, Общие положения - Виды и возможности СУБД
Общие положения Термины безопасность и целостность в контексте обсуждения баз данных часто используется совместно, хотя на самом деле, это совершенно...
-
Общие сведения. - Автоматизация регрессионного тестирования
В качестве инструмента для автоматизированного регрессионного тестирования был выбран Cucumber. Cucumber - приложение, широко используемое для...
-
ПОИСК ИНФОРМАЦИИ В ИНТЕРНЕТ - Интернет и его услуги
"Всемирная паутина" в Интернет - это миллионы документов с неструктурированной текстовой информацией (а также с графикой, аудио, видео). Чтобы найти...
-
Общие сведения об экранной клавиатуре - Операционная система Windows
Экранная клавиатура - это приложение, отображающее виртуальную клавиатуру на экране и позволяющее людям с ограниченной подвижностью печатать на экране с...
-
Обязанности дублеров инженерно-технических работников среднего звена: Обслуживание вычислительной техники всех подразделений колледжа, покупка...
-
Общая характеристика технологии создания программного обеспечения К программно-инструментальным средствам в первую очередь относятся алгоритмические...
-
Задания: 1. Найти не менее 5 сайтов по тематике, определенной в индивидуальном задании. 2. Оценить каждый сайт по следующим параметрам: - количественный...
-
Автоматизированного контроля летной годности ВС можно добиться путем внедрения определенного программного продукта, позволяющего оптимизировать...
-
К коммерческой тайне могут относиться следующие сведения: - Производство - Управление - Планы - Финансы - Рынок - Партнеры - Переговоры - Контракты -...
-
Первым вопросом, который необходимо решить при организации охраны коммерческой тайны, является определение круга сведений, составляющих коммерческую...
-
Общее описание системы Система Directum является корпоративной системой электронного документооборота, которая упрощает работу с большим потоком...
-
В разработке системы принимал участие один инженер-программист. Длительность выполнения работ по проектированию и разработке системы представлена в...
-
В данном пункте представлено описание подключенных систем к общей инфраструктуре ИС компании. В случае IBM SPSS: Вследствие того, что сбор данных с...
-
Для того, чтобы разработать оптимальный метод интеграции сторонних систем в существующую ИТ-инфраструктуру систем компании, требуется точно поставить...
-
Алгоритм работы. В результате работы АИС генерируются три xml документа - два со структурой сравниваемых баз данных и один с результатами сравнения. В...
-
Для написания АИС использовались следующие языки программирования, программные средства и библиотеки: - Язык программирования PHP 5.4; -...
-
Актуальность Сегодня всемирная популярность социальных информационных сетей продолжает набирать обороты, все большее пользователей не может отказать себе...
-
Этап Содержание работ Результаты работ Срок 1 Анализ существующей ЛВС Список критических точек сети, в которых необходимо резервирование оборудования,...
-
Поисковые системы - Глобальная вычислительная сеть Internet
Основная задача Internet -- предоставление необходимой ин-формации. Чтобы найти нужную информацию необходимо знать адрес Web-страницы, на которой эта...
Общие сведения - Web-индексы