|
Основная проблема поиска информации Разберем основную проблему в Internet: необходимо найти некоторую информацию, но неизвестны адреса сайтов, на которых она выложена. Тут на помощь приходят поисковые системы. Обычно для приемлемой работы в Internet достаточно помнить только адреса нескольких поисковых систем. Все остальные адреса можно найти там. Также для поиска используются каталоги ссылок. Там ссылки аккумулируются и разбиваются по темам и подтемам, как в библиотечных каталогах. Последнее время происходит слияние этих двух сервисов и практически на любом поисковом сервере имеется и каталог. Поисковые системы, это обычные сайты, на которые можно зайти с помощью браузера, написать в специальном поле текст запроса и система выдаст адреса документов из своей базы данных, на которых встречаются слова из запроса. На любое одиночное слово поисковая система может выдать несколько тысяч ссылок. Методы поиска - Обращение по URL (простейший метод поиска). Подразумевает наличие адреса URL и сводится к обращению клиента (программы клиента) к серверу определенного типа, т.е. отправке запроса с использованием определенного протокола.
- Использование набора ссылок Большинство серверов, представляющие гипертекстовые материалы общего вида, предлагают ссылки и на другие серверы (содержат URL адреса других ресурсов).
- Использование специализированных поисковых механизмов:
Поисковые машины. Основная идея поисковых машин - создание базы данных содержащей слова, встречающихся в документах Internet. В этой базе для каждого слова будет храниться список документов, содержащих это слово. Каталоги ресурсов. В каталогах используется иерархическая (древовидная) модель базы данных, так как любой ресурс, имеющий URL адрес, описание и другую информацию подчинен некой классификации. Поиск ресурсов Internet с использованием поисковых механизмов должен осуществляться по приведенным ниже этапам. Это оптимизирует результат поиска (количество найденных документов будет не столь велико, а соответствие их запросу - более близко к истине). Этапы поиска - Выделение тематических и географических регионов поиска. Для поиска русских документов лучше использовать русские поисковые механизмы. Это связано с тем, что на их иностранных аналогах эти документы представлены в очень небольших количествах и поиск в них может не дать ожидаемого результата;
- Составление тезауруса. Переход от описания предметной области к формализованным описаниям и построение, в конечном счете, формального текста, т.е. составление списка ключевых слов;
- Выбор поискового инструмента - метода поиска;
Составление запросов, руководствуясь синтаксисом выбранного поискового инструмента.
|