Главная arrow Поиск arrow Поиск поведения
Как начинался компьютер
Компьютерная революция
Двоичный код
Разработки военных лет
Интегральные микросхемы
Микрокомпьютер
Персоны
Сеть
Язык компьютера
Развитие ПО
Гибкие системы
Средства разработки
Информатика
Вычислительная наука
Операционные системы
Искусственный интеллект
Предыстория
Поиск
Знания и рассуждения
Логика
Робототехника
 

 
Поиск поведения Печать

Живая адаптирующаяся система должна всегда учиться. Она может считать, что знает правильное поведение, но должна беспрестанно доказывать, что это поведение действительно правильное, потому что внешний мир может измениться. Такое самообучение может происходить подсознательно (быть неосознаваемым). Именно в этом постоянном самообучении и состоит обычная работа сознания как биологического адаптивного механизма.

Управляя согласованным поведением жизненно важных систем организма, механизм сознания постоянно тестирует сам себя. Выживание данного существа (и выживание его сознания) зависит от правильной работы этих систем. Самотестирование служит для сдерживания творческого "полёта фантазии", который может расстроить систему управления. Поэтому человек, делающий работающие, логически непротиворечивые вещи, более способен к логичным рассуждениям, чем человек, создающий "нематериальные" творения. А бездельник вообще не может быть рассудительным. Между внутренним миром творца и бездельника такая же разница, как между внутренним миром человека и животного.

В процессе такого самотестирования мозг постоянно требует оценок своего поведения. Если мозг не получает оценок от внешнего мира за свое хорошее или плохое поведение, то он со временем теряет способность думать и управлять телом. Это происходит потому, что механизм случайного подбора поведения продолжает действовать и поведение (мозга), не закрепляемое оценкой, всё больше отличается от освоенного ранее, правильного с точки зрения жизнеобеспечения организма.

Мозг голого философа не получает оценок от внешнего мира за свое хорошее или плохое поведение. Поэтому спонтанные изменения свойств нейронов (это и есть простейший механизм творчества) постепенно приводят к жизненно опасным изменениям поведения мозга. Философ теряет разум.

И напротив, постоянный творческий поиск, сопровождаемый "объективной" оценкой поведения, укрепляет сознание. Бабочка "начинает понимать", то есть начинает поступать правильно в той ситуации, в которой она раньше не знала, что делать, и поступала неправильно. В приложении к более разумному существу и к некоторому виду задач мы бы могли назвать такой процесс накоплением опыта путём успешного "исследования".

Биологические мотивы творчества

Не только учитель воздействует на ученика с определенной целью, но и наоборот, ученик на учителя. Целью ученика является получение хорошей оценки. Если же обучение происходит без заинтересованности ученика, то это не ученик, а база данных, например, словарь или шахматная программа. Зачем и что нужно учить ученику, если у него нет никакого внутреннего направляющего стремления?

Может показаться, что на начальном этапе, пока интеллект ещё не развит или задача слишком новая, обучение может происходить без заинтересованности. Такое "незаинтересованное" привыкание существа к изменяющемуся внешнему миру происходит не бессознательно, так как именно сознание управляет адаптацией. При привыкании приходится приучаться к новому, полезному в новых условиях поведению.

Например, крысу приучают нажимать на педаль после звонка. Она не была заинтересована в нажимании на педаль, но она всегда имеет внутренний "интерес". Её интерес заключается в поддержании "нормальных" собственных ощущений. Эти ощущения являются субъективными и самоценными только для этой крысы. Но они же объективно даны ей природой как врождённые потребности.

Привыкание, адаптация или самообучение без постоянного стимулирования (без заинтересованности в самом процессе учёбы) похожи на естественный отбор, а обучение с учителем - на искусственный. Учитель выбирает и поощряет только правильные реакции ученика на заданные условия. Поскольку причинная связь между действиями ученика и поощрением хорошо заметна, такое умышленное обучение происходит гораздо быстрее, чем самообучение. При самообучении ученику приходится самостоятельно выявлять весьма сложные причинные зависимости между его поведением и полезным (для ученика) результатом.

Итак, биологическим стимулом для творчества является жизненно важная оценка. Если эту оценку даёт учитель, то скорость обучения возрастает. Если оценка "даётся" внешней средой, то она может быть и негарантированной, и сильно отложенной во времени. Внутренний механизм самообучения должен установить причинную связь между действиями существа и такой ненадёжной, но беспристрастной оценкой.

Мы считаем разумным или "целесообразным" такое поведение, которое удовлетворяет внутренние потребности организма. Эти потребности заданы биологически, но без правил или намёков на то, как их удовлетворить. Поскольку это не мои потребности, то я не всегда могу оценить разумность поведения того или другого существа.

Разум кибер-бабочки

Разумность поведения моей бабочки доступна моему пониманию, потому что я детально знаю её внутренние потребности. Сначала у неё нет картины мира. В её памяти хранятся случайные данные, настолько не похожие на мир, в который она попадает, что этот мир не вызывает у неё никаких надёжных ассоциаций. У бабочки нет представлений о логике, пространстве или времени. Всё это появляется в результате реального опыта. По мере накопления опыта она начинать узнавать разные ситуации, в которых она оказывается: как это было раньше, и как она поступала раньше. Она выбирает из прежнего опыта более успешное поведение. Все возможные "идеи" бабочки представимы только в виде наблюдавшихся ранее образов или их фрагментов. Бабочка не имеет никаких отвлечённых от опыта средств преставления своих "мыслей".

Самообучение и творчество бабочки состоит в том, что полезный опыт накапливается и на его фоне происходит постоянный случайный поиск нового поведения.

Случайность, приводящую к обнаружению нового поведения, можно трактовать, как неудачную попытку точно повторить то поведение, которое бабочка считает успешным, или как неточное воспроизведение успешного прежнего поведения. Оба варианта могут быть следствиями как случайных нарушений в памяти, так и неточного узнавания текущей ситуации.

Тестовая задача о "бабочке и цветке" демонстрирует не какой-то изысканный или очень эффективный алгоритм сознания, а принципиальную возможность нахождения правильного "разумного" поведения только на основе неясного внутреннего желания произвольной природы. Если через некоторое время вы заметите, что вероятность попадания бабочки на цветок больше, чем вероятность попадания в какую-то определённую назначенную вами другую точку окна, то это и означает, что бабочка уже узнаёт цветок, и стремится к нему, то есть, она ориентируется в пространстве.

Если сделать окно сразу большим, то, вероятно, бабочка никогда не научится находить цветок, так как будет мало случайного успешного опыта. Но может случайно повезти.

От чего зависит скорость обучения в этом примере? От успешного опыта. Можно помогать бабочке учиться, например, подставляя цветок с нужной стороны, чтобы она постепенно освоила весь необходимый набор движений. Но учтите, что способности бабочки ограничены. Она может достичь максимально возможного для неё мастерства в течение нескольких минут. И дальнейшее обучение больше ничего не даст. А можно ей вредить. И она никогда не научится.

Мозг живой бабочки, как и мозг кибер-бабочки "стремится повторить успех". Живая бабочка летит к цветку, потому что её привлекает запах. Этот запах ей нравится от рождения. Поэтому я не могу уверенно сказать, что она сознательно стремится к цветку. Во всяком случае, её сознанию каждую секунду помогает безусловный рефлекс на запах.

В рассмотренной тестовой задаче нет никаких прямых "физических" воздействий (вроде запаха) со стороны цветка на бабочку. Она не испытывает удовольствия от того, что видит цветок. Она летит к нему потому, что из своего опыта она знает, что получит удовольствие, когда коснётся цветка. Её привлекает не запах и даже не вид цветка, а знание (идея, понимание) того, что правильное поведение завершится удовольствием . Это чисто интеллектуальное стремление или условный рефлекс. Она сознательно стремится коснуться цветка, потому что использованный алгоритм не предусматривает автоматизации поведения. Эта бабочка осознаёт то, что она видит.

Совершенно правильные движения бабочки не приводят к немедленному успеху, так как требуется преодолеть некоторое расстояние до цветка, а бабочка не имеет органа восприятия расстояния. "Вид цветка" никак не изменяется по мере приближения к нему. Поэтому бабочка испытывает неуверенность. Кажется, что она делает "неоправданно" много случайных попыток улучшить своё поведение, которое, в результате, становится похожим на панику. "Кто мало видел - много плачет".

От смутного желания к осознаванию себя

Вообще-то можно построить систему, имитирующую разумное поведение, но не имеющую внутреннего мотива к поиску такого поведения. Пусть эффекторы точно исполняют поступающие от мозга команды. Если их поведение не устраивает разработчика, то происходит перекоммутация входных и выходных каналов, другие настройки мозга. Обычно, например, в практике нейронных сетей, эти настройки называют обучением. В такой системе ни мозг, ни отдельные нейроны или органы чувств не обладают самостоятельным творчеством или свободой выбора поведения. Поведение, как выходной сигнал, строго ассоциировано с входными данными. После обучения такая система представляет собой автомат, имитирующий разумное (с точки зрения человека) поведение. Хотя прогноз наблюдения не требуется, но он может использоваться для автоматизации процесса обучения.

Перед прогнозирующим механизмом системы можно поставить задачу получения не правильного прогноза, а определённого прогноза. Это выглядит так, будто сенсоры "стремятся" почувствовать что-то определённое. Для этого обучающий механизм, например, алгоритм перекоммутации межнейронных связей, должен иметь возможность и средства для синтеза нового поведения, которое обеспечит достижение этих определённых чувств. Только такой выгодный для системы субъективный прогноз может сделать её творческой и сознательной.

Чтобы система не распалась на отдельные "осознающие себя" подсистемы, все её средства прогнозирования и подбора поведения должны стремиться к общей цели: обеспечить "выгодный" прогноз определёнными сенсорами. Выгодный прогноз – это предвидение определённой положительной оценки (ощущения), которая присуща системе от природы или предусмотрена разработчиком. Творческая прогнозирующая система подчиняется этой задаче в ущерб объективному прогнозу. Такая система стремится повторить (правильно "предвидеть") своё успешное поведение, и выполняет небольшой случайный поиск нового поведения на фоне этого уже освоенного.

Основная проблема самообучения состоит в том, что обучающееся существо не знает, за что оно получает оценки (поощрения и наказания). Я предполагаю, что биологически эта задача решается так. Если существо чувствует себя хорошо, то есть все его желания удовлетворены, и состояние организма нормальное, то оно способно сохранить в памяти свои восприятия и поведение в течение некоторого времени. Если состояние организма ухудшается, то способности к запоминанию тоже ухудшаются. Поэтому поведение, которое приводит к нормальному или субъективно лучшему состоянию организма, запоминается лучше.

Если субъективно привлекательные ощущения достигаются слишком легко, в результате слишком простого поведения, то организм попадает в психическую зависимость, так как простое поведение быстро становится автоматическим и неподконтрольным осознаванию. В результате "сознательное" существо теряет свободу выбора других поведений, кроме тех, которые ведут к легко достижимой "эйфории".

Критерий успеха – удовлетворённое желание

У бабочки субъективное прогнозирование управляется "анализатором успеха". Его задача выявить и сохранить важную информацию (не объективную, не точную, а субъективно важную для удовлетворения желания), и попробовать достичь ещё большего успеха. Несмотря на загадочное название, это устройство выполняет простую функцию. Оно запрещает органам бабочки вспоминать неуспешный опыт. Но более важно то, что этот механизм объединяет алгоритмически независимые органы бабочки в единую систему с общими желаниями и согласованно исполняемыми целями. Благодаря этой централизации бабочка воспринимает себя как единое "Я", а не как колонию органов.