Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Поисковые службы




В попытках облегчить поиск в Web нужной информации разработаны сотни различных поисковых служб. Поисковая служба представляет собой Web-узел с интерактивной индексированной базой данных, в которой Web-узлы классифицированы, как правило, с помощью метадескрипторов. Метадескрипторы — это ключевые слова, добавленные Web-дизайнером. Согласно www.wwwmwtric.com (на этом узле приводится статистическая информация по Web) к услугам поисковых служб прибегают 85% пользователей, однако индексированы поисковыми службами лишь 20% общедоступных Web-узлов.

Первой солидной поисковой службой была Yahoo (www.yahoo.com), которая и сейчас пользуется большой популярностью. Ниже приведен список наиболее часто посещаемых поисковых служб.

  • Lycos (www.lycos.com).
  • DirectHit (www.directhit.com).
  • Excite (www.excite.com).
  • AltaVista (www.altavista.com).
  • Northern Light (www.northern light.com)-
  • Google (www.google.com).

Принцип действия большинства поисковых служб основан на анализе ключевых слов, или метадескрипторов, добавленных к HTML-страницам их разработчиками. Эти ключевые слова представляют собой технические или научные термины, по которым пользователь вручную искал бы материалы с нужной ему тематикой в реферативных журналах. Допустим, что пользователь хочет найти что-нибудь о разведении сиамских котов. В этом случае его заинтересуют страницы HTML с ключевыми словами "кот", "сиамский", "разведение" или "сиамский кот".

В поисковых службах применяются приведенные ниже компоненты.

  • Паук (spider). Программа, "путешествующая" по различным Web-узлам и собирающая индексную информацию.
  • Индексная база данных. База данных, в которой хранится индексная информация, собранная пауком.
  • Механизм поиска и выдачи результатов. Программы интерфейса между пользователями и поисковой службой, с помощью которых пользователи задают свои вопросы и получают ответы.

Некоторые поисковые службы могут в поиске ключевых слов перебирать не только метадескрипторы HTML-страниц, но и весь текст страниц. Это значительно увеличивает количество найденных страниц, но среди них будет намного больше ненужных. Пусть, например, пользователь ищет рецепт торта и поисковая служба нашла ему все страницы HTML, в тексте которых встречается слово "торт". Очевидно, что подавляющее большинство страниц будут содержать не кулинарные рецепты, интересующие пользователя, а все, что угодно, включая детективы и последние новости. Такой поиск может оказаться бесполезным, потому что в предложенных пользователю страницах HTML найти интересующие его кулинарные рецепты будет практически невозможно.

Повысить эффективность поиска можно путем правильного использования алгоритмов поисковой службы. Чаще всего в алгоритмах поиска используются логические функции И, ИЛИ и НЕТ. Вернемся к нашему примеру с тортом. Круг поиска значительно сужается, если в строке запроса ввести "торт И рецепт". В этом случае поисковая служба отбросит страницы, в которых есть торты, но нет рецептов, и страницы, в которых есть рецепты, но нет тортов.

Большинство поисковых служб не могут индексировать содержимое Web-узлов, защищенных паролем. Еще нужно учитывать, что после загрузки документа на Web-cepeep пройдет некоторое время, прежде чем его индексирует какая-либо поисковая служба. Поэтому в базах данных поисковых служб обычно нет документов, загруженных недавно.


Поделиться:

Дата добавления: 2015-08-05; просмотров: 73; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.007 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты