Главная arrow Поиск arrow Примитивный случайный поиск
Как начинался компьютер
Компьютерная революция
Двоичный код
Разработки военных лет
Интегральные микросхемы
Микрокомпьютер
Персоны
Сеть
Язык компьютера
Развитие ПО
Гибкие системы
Средства разработки
Информатика
Вычислительная наука
Операционные системы
Искусственный интеллект
Предыстория
Поиск
Знания и рассуждения
Логика
Робототехника
 

 
Примитивный случайный поиск Печать

Новое поведение находится путём случайного поиска в окрестности уже освоенного поведения

Случайный поиск исключительно неэффективен. Максимум, что можно ещё пытаться угадать - это информация из нескольких бит. Уже 10 бит, то есть тысяча равноправных вариантов – много даже для человека. Поэтому поиск нового должен происходить на фоне уже освоенного и известного. Причём это новое должно быть минимально информационно насыщенно (минимально содержательно). После успешного нахождения "новых бит" и согласования их с имеющимися знаниями, они включаются в "освоенные" знания. И далее поиск нового продолжается такими же мельчайшими шажками.

Для оценки скорости самообучения при случайном подборе поведения рассмотрим обучение таблицы перекодировки. Таблица содержит N ячеек, то есть она способна запомнить реакцию на N входных сигналов. Внешняя среда может обеспечить N разных входных сигналов, причём каждому сигналу соответствует одна правильная реакция таблицы в виде числа от 1 до N. Входные сигналы меняются случайно. Реакция является случайной (1 - N), если ответ не известен. Реакция запоминается, если за неё дана положительная оценка.

При таких условиях вероятность того, что на случайный входной сигнал будет случайно дан правильный ответ равна 1/N. Средняя степень обучения (то есть, почти на каждый входной сигнал найден правильный ответ) будет достигнута за N2 шагов. Если вход имеет ширину 64 бита, то N2 = 2128 = 1040. Самообучение всегда слишком долгое, а в данном примере, оно невозможно.

Такое "универсальное" самообучение технически бесперспективно. Вместо него применяется обучение искусственных систем учителем (супервизором). Учитель может вести систему “за ручку” по правильному пути. При этом она не может научиться находить путь, но будет знать, какой путь правильный. А если учитель ещё и показывает правильное поведение (принуждает систему вести себя правильно) и поощряет такое поведение, то скорость обучения значительно возрастает.

Однако в жизни самообучение – обычное дело, особенно у простейших животных, а следовательно, и у простейших нейронных структур. Мозг не мог знать до рождения, в каком мире он окажется. В отличие от "физических" органов чувств, "информационный" мозг вообще не имеет прямого контакта с физическим миром. Но, тем не менее, кошка сумеет выжить, даже если она ни разу в жизни не увидит мышку. Мозг достаточно абстрактен и универсален, чтобы приспособиться к любым окружающим условиям. Как он обучается? Также как дети, испытывая разные варианты поведения в окрестностях уже освоенных. Вследствие универсальности мозгу запрещено использовать такие конкретные информационные инструменты, как "уравнения", "правила" и "семантический разбор".