Как начинался компьютер
Компьютерная революция
Двоичный код
Разработки военных лет
Интегральные микросхемы
Микрокомпьютер
Персоны
Сеть
Язык компьютера
Развитие ПО
Гибкие системы
Средства разработки
Информатика
Вычислительная наука
Операционные системы
Искусственный интеллект
Предыстория
Поиск
Знания и рассуждения
Логика
Робототехника
 

 
ИПС Печать

Информационно-поисковые системы на основе мультиагентного подхода

Эффективный доступ к информации в связи с экспоненциальным ростом объема Интернет-ресурсов становится всё более сложным и трудоемким. Существующие информационно-поисковые сервисы и системы (ИПС) недостаточно хорошо справляются со своими задачами. В последнее время начали разрабатываться ИПС, основанные на концепции интеллектуальных агентов. В последнее время начали разрабатываться поисковые системы, основанные на концепции интеллектуальных агентов. Следует отметить проект SAIRE - масштабируемый, основанный на агентах механизм информационного поиска. SAIRE обеспечивает интегрированный доступ пользователя к распределенным источникам данных, включая цифровые библиотеки NASA и NOAA.

Основными недостатками подобных систем является, в первую очередь, недостаточность возможности предварительного обучения агентов на уже имеющемся материале, а также невозможность коррекции поиска с помощью материалов из других источников.

Рассмотрим структуру ИПС с применением агентного подхода. Между пользователем и информационным наполнением сети располагаются три слоя. Первый слой - это ИПС глобальной сети. ИПС осуществляют первичный сбор информации о ресурсах Интернет. Второй слой представляет собой мультиагентную систему (МАС), выполняющую поисковые операции. Основные задачи данной системы: динамическое распределение поискового процесса по различным ИПС; осуществление всех фаз взаимодействия с ними; проверка актуальности ссылок и получении выбранных документов; проверка полученных документов на релевантность и ранжирование. МАС осуществляет адаптацию поискового процесса, как к источникам, так и к потребителю информации. Третий слой - это система управления документами (СУД), ориентированная на работу в глобальной сети. Основной задачей СУД, в данном контексте, является автоматизация составления поискового запроса. Основная идея использования СУД заключается в создании поискового запроса на основе анализа имеющихся у пользователя документов по искомой тематике.

Автоматизированное построение поискового запроса происходит в диалоговом режиме. Пользователь выбирает уровень иерархии кластеров и релевантный кластер этого уровня (либо несколько кластеров, указывая их релевантность), а также, при необходимости, осуществляет корректировку разбиения, путем добавления или исключения из выбранного кластера отдельных документов.

Предполагается использовать три типа агентов: агенты данных (D-агенты); поисковые агенты (S-агенты) и новостные агенты (N-агенты). Агенты данных составляют важнейшую часть системы, они служат интерфейсом с СУД, взаимодействуют с поисковыми агентами и непосредственно с содержательными ресурсами глобальной сети. Каждому документу, содержащемуся в СУД поставлен в соответствие агент данных. Поисковые агенты обеспечивают интерфейс между МАС и глобальными ИПС. Каждой используемой в системе ИПС поставлен в соответствие S-агент. В некоторых, особых случаях, когда соответствующая ИПС вырабатывает хорошие результаты, ей могут быть поставлены в соответствие несколько копий одного S-агента. Новостные агенты обеспечивают интерфейс между МАС и обнаруженными в сети ценными (высокоинформативными) источниками информации. Одному такому источнику информации ставится в соответствие один N-агент. Также существует репозиторий (СУБД), содержащий несколько баз данных (БД): БД найденных документов; БД созданных N-агентов; БД по D-агентам и БД S-агентов. Репозиторий необходим для эффективного разделения работы агентов и для выявления авторитетных источников информации. Арбитр ресурсов осуществляет перераспределение ресурсов МАС между отдельными D-агентами для обеспечения эволюции путем отбора наиболее приспособленных. Арбитр ресурсов следит за численностью популяции D-агентов.

Анализ методов поиска с использованием агентов при сборе поиске и анализе информации показал ряд преимуществ: они могут обеспечить пользователю доступ ко всем Интернет-сервисам; преимущество агентов в том, что они могут осуществлять поиск по заданию пользователя после его отключения от сети; они могут создавать собственную базу информационных ресурсов, которая обновляется с каждым поиском; агенты могут использовать модель пользователя для корректировки и уточнения запросов; они могут адаптироваться под предпочтения и желания пользователя и, изучив их искать полезную информацию заранее.