Как начинался компьютер
Компьютерная революция
Двоичный код
Разработки военных лет
Интегральные микросхемы
Микрокомпьютер
Персоны
Сеть
Язык компьютера
Развитие ПО
Гибкие системы
Средства разработки
Информатика
Вычислительная наука
Операционные системы
Искусственный интеллект
Предыстория
Поиск
Знания и рассуждения
Логика
Робототехника
 

 
Мир вампуса Печать
Мир вампуса — это пещера, состоящая из залов, соединенных проходами. Где-то по этой пещере бродит вампус — страшный зверь, который поедает всех, кто входит в зал, где он находится. Вампус может быть убит агентом, но у агента есть только одна стрела. В некоторых залах есть бездонные ямы, в которые попадают все, кто проходит через эти залы (все кроме вампуса, который слишком велик для того, чтобы в них провалиться). Единственное, что утешает живущих в этой среде, — это возможность найти кучу золота. Хотя мир вампуса является довольно скромным с точки зрения современных стандартов компьютерных игр, он представляет собой превосходную испытательную среду для интеллектуальных агентов. Первым, кто предложил использовать мир вампуса для такой цели, был Майкл Генезерет.

  • Показатели производительности. За то, что агент находит золото, он получает +1000 очков, за то, что агент попадает в яму или его съедает вампус, ему назначается -1000 очков, он отдает -1 очко за каждое выполненное действие и -10 очков — за использование стрелы.
  • Среда. Залы расположены в виде решетки 4x4. Агент всегда начинает движение с квадрата, обозначенного как [1,1], и смотрит вправо. Местонахождения золота и вампуса выбираются случайным образом с равномерным распределением из числа квадратов, отличных от начального квадрата. Кроме того, в каждом квадрате, отличном от начального, с вероятностью 0,2 может находиться яма.


Пример мира вампуса. Агент находится в нижнем левом углу

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • Исполнительные механизмы. Агент может двигаться вперед, поворачиваться влево и вправо на 9 0°. Агент погибает жалкой смертью, если входит в квадрат, где имеется яма или живой вампус. (Входить в квадрат с мертвым вампусом безопасно, но при этом приходится чувствовать неприятный запах.) Попытка продвижения вперед остается безрезультатной, если перед агентом находится стена. Чтобы схватить объект, находящийся в том же квадрате, где находится агент, можно воспользоваться действием Grab. С помощью действия Shoot можно пустить стрелу по прямой линии в том направлении, куда смотрит агент. Стрела продолжает движение до тех пор, пока она либо не попадет в вампуса (и убьет его), либо не ударится в стену. У агента имеется только одна стрела, поэтому какой-либо эффект оказывает лишь первое действие Shoot.
  • Датчики. У агента имеется пять датчиков, каждый из которых сообщает только один элемент информации:
  • в квадрате, где находится вампус, а также в квадратах, непосредственно (а не по диагонали) соседних по отношению к этому квадрату, агент чувствует неприятный запах (восприятие Stench);
  • в квадратах, непосредственно соседних с ямой, агент будет чувствовать ветерок (восприятие Breeze);
  • в квадрате, где находится золото, агент видит блеск (восприятие Glit ter);
  • когда агент наталкивается на стену, он чувствует удар (восприятие Bump).
  • перед тем как пораженный стрелой вампус умирает, он испускает жалобный крик, который разносится по всей пещере (восприятие Scream).

Результаты актов восприятия передаются агенту в форме списка из пяти символов; например, если есть неприятный запах и ветерок, но нет блеска, удара или крика, агент воспринимает результаты акта восприятия [Stench, Breeze, None, None, None].

Предлагается определить среду вампуса в соответствии с различными измерениями. Основная сложность для данного агента состоит в том, что он с самого начала не знает конфигурацию своей среды; по-видимому, для преодоления этого незнания нельзя обойтись без логических рассуждений. В большинстве экземпляров мира вампуса для агента существует возможность безопасно получить золото. Но иногда агенту приходится выбирать: вернуться ли домой с пустыми руками или рисковать жизнью, чтобы найти золото. Около 21% вариантов среды являются совершенно неблагоприятными, поскольку золото находится в яме или окружено ямами.

Проследим за агентом для мира вампуса, действующим на основе знаний, который изучает среду, показанную на рисунке. Первоначальная база знаний агента содержит правила существования в этой среде, которые были описаны выше; в частности, агент знает, что находится в квадрате [1,1] и что квадрат [1,1] является безопасным. Мы увидим, как расширяются знания агента по мере того, как поступают результаты новых актов восприятия и выполняются действия.

Первым восприятием является [None, None, None, None, None], на основании которого агент может сделать вывод, что соседние по отношению к нему квадраты являются безопасными. На рисунке, а показано состояние знаний агента в этот момент. Мы будет перечислять (некоторые) высказывания из базы знаний с использованием буквенных обозначений, таких как В (чувствуется ветерок) и ОК (безопасно — ни ямы, ни вампуса), проставленных в соответствующих квадратах. С другой стороны, на рисунке изображен сам этот мир.


Первый шаг, выполненный агентом в мире вампуса: первоначальная ситуация, возникшая после восприятия /"None, None, None, None, None 7 (а); ситуация после одного хода, в котором получено восприятие /"None, Breeze, None, None, None] F)

 

 

 

 

 

 

 

 

 

 

 

На основании того факта, что в квадрате [1,1] не было ни неприятного запаха, ни ветерка, агент может сделать вывод, что квадраты [1,2] и [2,1] свободны от опасности. Для указания этого они отмечены обозначением ОК. Осторожный агент переходит только в такой квадрат, о котором известно, что в нем есть отметка ОК. Предположим, что агент решил двинуться вперед, в квадрат [2,1], и была создана сцена, показанная на рисунке.

Агент обнаруживает ветерок в квадрате [2,1], поэтому в одном из соседних квадратов должна быть яма. По правилам игры яма не может находиться в квадрате [1,1], поэтому она должна быть в квадрате [2,2], или [3,1], или в том и другом. Обозначение Р? на рисунке, б указывает на возможность наличия ямы в этих квадратах. В данный момент известен только один квадрат с отметкой ОК, который еще не был посещен. Поэтому благоразумный агент поворачивается кругом и возвращается в квадрат [ 1,1 ], а затем переходит в квадрат [1,2].

Новым восприятием в квадрате [1,2] является [Stench,None,None, None, None], что приводит к состоянию знаний, показанному на рисунке. Наличие неприятного запаха в квадрате [1,2] означает, что где-то рядом есть вампус. Но вампус не может находиться в квадрате [1,1] по правилам игры и не может быть в квадрате [2,2] (поскольку агент обнаружил бы неприятный запах, находясь в квадрате [2,1]). Поэтому агент может сделать вывод, что вампус находится в квадрате [1,3]. На это указывает обозначение W!. К тому же из отсутствия восприятия Breeze в квадрате [1,2] следует, что в квадрате [2,2] нет ямы. Тем не менее мы уже пришли к выводу, что яма должна быть в квадрате [2,2] или [ 3 ,1 ], а это означает, что она действительно находится в квадрате [3,1]. Это — весьма сложный логический вывод, поскольку в нем объединяются знания, полученные в разное время в различных местах, и в нем решение о выполнении важного шага сделано на основании отсутствия определенного восприятия. Такой логический вывод превосходит способности большинства животных, но является типичным для рассуждений такого рода, которые выполняются логическими агентами.


Два последних этапа в ходе деятельности агента: после третьего хода, когда было получено восприятие /"Stench, None, None, None, None] (а); после пятого хода, когда было получено восприятие /"Stench,Breeze,Glitter,None,None] F)

 

 

 

 

 

 

 

 

 

 

 

Теперь агент доказал сам себе, что в квадрате [2,2] нет ни ямы, ни вампуса, поэтому может обозначить этот квадрат меткой ОК, чтобы в него перейти. Мы не показываем состояние знаний агента в квадрате [ 2, 2 ], а просто предполагаем, что агент повернулся и перешел в квадрат [ 2, 3 ], в результате чего было получено состояние, показанное на рисунке. В квадрате [2,3] агент обнаруживает блеск, поэтому должен схватить золото и тем самым закончить игру.

В каждом случае, когда агент выводит заключение из доступной ему информации, гарантируется правильность этого заключения, если доступная информация является правильной. В этом состоит фундаментальное свойство логических рассуждений. В оставшейся части данной главы будет показано, как создавать логических агентов, которые могут представлять необходимую информацию и делать выводы, описанные в предыдущих абзацах.