Алгоритмы анализа гиперссылок позволяют механизмам поиска создавать адекватные результаты в ответ на запросы пользователей. В статье рассматриваются алгоритмы ранжирования, используемые при извлечении информации из Web.Извлечение информации (information retrieval) — это область компьютерных технологий, которая ставит своей целью поиск всех документов из данного множества, отвечающих условиям запроса пользователя. В этом случае извлечение информации, на самом деле, следует назвать извлечением документов. До появления Web системы извлечения информации, как правило, устанавливались в библиотеках, где они обычно использовались библиографами-консультантами. Алгоритм извлечения в этих системах, в основном, базировался на анализе слов в документе.Всемирная паутина все изменила. Теперь каждый пользователь Web может обращаться к разнообразным механизмам поиска, алгоритмы извлечения в которых часто анализируют не только слова в документах, но и такую информацию, как структура гиперссылок Web или теги языка разметки.Зачем нужны гиперссылки? Сама по себе гиперссылка (т. е. гиперссылка на Web-страницу B, содержащаяся в Web-странице A) для извлечения информации прямой пользы не дает. Однако способ применения гиперссылок, который авторы Web-страницы используют, позволяет получить адекватное информационное наполнение. Как правило, авторы оформляют гиперссылки, которые, по их мнению, могут быть полезны читателям. Некоторые из гиперссылок оказывают помощь в навигации, например, позволяют вернуться на домашнюю страницу сайта; другие обеспечивают доступ к документам, дополняющим информацию, размещенную на текущей странице. Последние, как правило, указывают на очень важные страницы, посвященные той же теме, что и страница, содержащая гиперссылку. Системы извлечения информации в Web могут использовать эти данные для улучшения качества поиска необходимых документов.Анализ гиперссылок значительно увеличивает релевантность результатов поиска, причем настолько, что все ведущие механизмы поиска в Web в той или иной степени используют анализ гиперссылок. Однако компании, реализующие механизмы поиска, не сообщают подробности о том, какой вид анализа гиперссылок они выполняют. Это делается главным образом для того, чтобы предотвратить разного рода манипуляции с результатами поиска, к которым прибегают компании, занимающиеся позиционированием в Web.Анализ гиперссылок в WebВ основу алгоритмов анализа гиперссылок положено одно либо оба из следующих допущений.Допущение 1. Г
Моника Хензингер
Алгоритмы анализа гиперссылок позволяют механизмам поиска создавать адекватные результаты в ответ на запросы пользователей. В статье рассматриваются алгоритмы ранжирования, используемые при извлечении информации из Web.
Анализ гиперссылок в Web
Поиск: Весь сервер Новости Computerworld Мир ПК Открытые системы Windows IT Pro LAN Сети Директор ИС Следите за нами: Авторизоваться с помощью:
Анализ гиперссылок в Web - 10, 2001 | Открытые системы | Издательство «Открытые системы»
Комментариев нет:
Отправить комментарий