Главная arrow Логика arrow Понимание естественного языка
Как начинался компьютер
Компьютерная революция
Двоичный код
Разработки военных лет
Интегральные микросхемы
Микрокомпьютер
Персоны
Сеть
Язык компьютера
Развитие ПО
Гибкие системы
Средства разработки
Информатика
Вычислительная наука
Операционные системы
Искусственный интеллект
Предыстория
Поиск
Знания и рассуждения
Логика
Робототехника
 

 
Понимание естественного языка Печать

Воспользуемся рассмотренными свойствами виртуальной реальности в разработке формализованного представления смысла текста и системы его обработки. Для решения этой проблемы достаточно разработать любую виртуальную реальность, законы функционирования которой позволят решить поставленную задачу. Практическая реализация найденного решения на последовательных цифровых вычислительных системах будет возможна благодаря трансляции виртуальной машины, реализующей сконструированную виртуальную реальность, в виртуальную машину, работающую в виртуальной реальности, созданной операционной системой.

Прежде всего, необходимо понять, что будет пониматься под термином "Смысл предложения". Так как поиск решения будет проходить в виртуальной реальности, с законами постулированными в процессе поиска решения, то будет достаточно определить термин "Смысл предложения”, способом позволяющим автоматически извлекать и обрабатывать смысл предложения из текста на естественном языке.

Определим "смысл предложения" в виде следующего утверждения: Смысл предложения – это смысл содержания предложения. Содержание предложения, очевидно, является информацией. Но информация является информацией только в контексте системы для ее обработки. Значит, смысл должен быть представлен системе обработки в виде, пригодном для обработки. Таким образом, представление смысла в системе обработки смысла должно быть "естественным" для этой системы и будет зависеть от реализации этой системы.

Перечислим требования к системе обработки смысла: возможность реализации в парадигме материального мира, очень высокая степень распараллелености вычислительных процессов; высокая надежность, способность оперировать нечеткой и неполной информацией, способность оперировать связями между различными понятиями[4]. Исходя из перечисленных требований, построим некоторую виртуальную машину, в терминах которой возможно было бы обрабатывать объекты (сущности или концепты), отношения между объектами, нечеткие факторы уверенности и логические величины. Обработка и представление перечисленных понятий не вызывает каких либо затруднений в виртуальной машине, организованной в виде нейронной сети. Так отдельные элементарные объекты представляются в виде отдельных нейронов.

Более сложные объекты, образованные от элементарных объектов, будут представлены либо совокупностью этих объектов, либо будут абстрагированы до нового элементарного объекта. Элементарные отношения между элементарными объектами представляются в виде связей между нейронами. Сложные отношения или классы отношений между объектами фактически являются сложными понятиями-объектами и могут обрабатываться как совокупности элементарных объектов, связанных между собой элементарными связями. Факторы уверенности представляются в виде градиентных величин, обрабатываемых и передаваемых нейронами.

В разработанной виртуальной реальности, смыслом обработанной части текста, будет являться мгновенное состояние части нейронной сети, ответственной за извлечение информации из входного потока символов. Мгновенное состояние нейронной сети будет включать в себя мгновенный снимок множества нейронов, множества связей между нейронами и множества внутренних состояний нейронов. Таким образом, формальным представлением символьной информации в нейронной сети может выступать семантическая нейронная сеть, а обработка такого формализованного представления текста в виде нейронной сети будет производиться стандартными для этой нейронной сети способами.

Обычно под нейронной сетью понимается биологическая нейронная сеть, либо математическая модель биологической нейронной сети. В рассматриваемой виртуальной реальности у нейрона отсутствуют синаптические контакты. В отличие от биологической нейронной сети нейроны обмениваются аналоговыми сигналами с непрерывно изменяющейся амплитудой, а не пачками импульсов с фиксированной амплитудой. Нейроны выполняют не функции интегрирования сигналов, а функции алгебры логики, что более удобно при реализации на цифровых вычислительных машинах. Следовательно, полученную нейронную сеть так же можно рассматривать как некоторую алгебру. Операции алгебры логики представляются в нейронной сети отдельными нейронами, значения предметных переменных представляются в виде градиентных значений, обрабатывающихся нейронной сетью, а последовательность применения операций задается структурой связей между нейронами.

Так как отдельные нейроны в рассматриваемой нейронной сети представляют собой элементарные понятия обрабатываемого смысла, а связи между нейронами представляют собой элементарные отношения между понятиями, то такую сеть будем называть семантической нейронной сетью.

Текст на естественном языке представлен в виде последовательного потока символов. Различным вариантам состояния входного потока символов в нейронной сети будут соответствовать различные варианты состояния этой сети. Преобразование входного потока символов в состояние нейронной сети может быть выполнено рецепторами. Рецепторы, распознающие однотипные внешние воздействия, такие как символы текста, организуются в специализированные слои рецепторов. Входной поток символов подается на слой нейронов - рецепторов, при этом каждый рецептор в слое распознает только один символ алфавита входной последовательности, игнорируя все остальные. В случае если символ распознан, на выходе рецептора устанавливается градиентное значение соответствующее уровню успешного распознавания символа, например значение "логической истины".

Если в единицу времени рецепторам представить для опознания один символ, то только один нейрон будет иметь логическое значение "истина" остальные будут иметь логическое значение "ложь", то есть в один такт рецепторами будет опознаваться только один символ текста.

Вывод результатов обработки текста из нейронной сети может быть выполнен эффекторами. Эффекторы, реализующие однотипные воздействия на окружающую среду, организуются в специализированные слои эффекторов. Так вывод текстов в виде символьной последовательности может быть осуществлен слоем эффекторов, в котором каждому нейрону будет соответствовать один выводимый символ алфавита. В единицу времени только один эффектор будет активирован входным градиентным уровнем, что будет соответствовать одному символу, печатаемому на дамповом терминале. Возможно агрегирование нескольких понятий одним эффектором. Например, при выводе прилагательного, эффектор соответствующий прилагательным будет находиться в активном состоянии, а именам существительным - в пассивном.

Важно заметить, что в случае коммутации двух нейронных подсетей друг с другом одни и те же нейроны могут выполнять в одной подсети функции рецепторов, а в другой подсети - функции эффекторов. Поэтому рецепторами и эффекторами будем называть не только нейроны, выполняющие обмен информацией с внешней средой, но и нейроны выполняющие обмен информацией с любым её источником или приемником.

Применяя метод интроспекции, можно легко установить, что понимание смысла текста не является статическим, мгновенным процессом. Понимание смысла - процесс развивающийся во времени. Понимание и уточнение смысла происходит по мере поступления новых данных. Практически любая часть предложения имеет смысл. Это легко проверить, прочитав сначала первое слово, затем первые два слова, затем - первые три, четыре… Элементарным смыслом обладают даже отдельные буквы. По мере поступления новой информации смысл уже обработанных данных просто уточняется, обычно без повторной обработки уже поступивших данных.

Отдельный нейрон, расположенный в слое нейронной сети, извлекающей смысл из текста на естественном языке, будет обозначать элементарное понятие анализируемого языка. Элементарными понятиями являются любые понятия естественного языка с законченным смыслом, такие как символ, часть слова, слово, словосочетание, предложение, абзац, весь текст. В случае наличия соответствующего понятия в анализируемом тексте нейрон принимает значение "Истина", а в случае отсутствия - "Ложь". Так как процесс анализа текста развивается во времени, по мере поступления в нейронную сеть новых данных, то в нейронной сети возникают волны активности, распространяющиеся от рецепторов к эффекторам.

Можно постулировать, что одному фронту такой волны соответствует смысл текста, принятого сетью непосредственно перед началом этого фронта. Тогда окончанием обработки текста можно считать достижение слоя эффекторов фронтом волны, порожденным последним символом обрабатываемого текста. В результате на слое эффекторов, в виде состояний эффекторов, будет выставлен смысл текста.

Смысл текста на естественном языке представляется в нейронной сети как мгновенное состояние множества выходных нейронов, находящихся в слое извлечения смысла из входной последовательности. Поэтому, преобразование одного смысла в другой смысл представляет собой преобразование состояния одной группы нейронов в состояние другой группы нейронов. Состояние нейронов характеризуется значением выходных градиентных данных. Для преобразования смысла в виде градиентных данных могут применяться экспертные системы. Отдельные операции над обрабатываемым смыслом представляются как отдельные правила в базе знаний экспертной системы.

Правила помещаются в базу знаний. Так же в базу знаний, в виде фактов, помещаются входные данные, и результаты срабатывания правил. Если ситуация, анализируемая экспертной системой, удовлетворяет условиям срабатывания правила, то его следствия считаются верными для данной ситуации.

Для реализации экспертной системы, основанной на правилах, средствами нейронной сети необходимо преобразовать сеть правил в нейронную сеть. В процессе преобразования необходимо обеспечить решение следующих проблем: управление вниманием и объяснение полученных результатов. Управление вниманием разбивается на подзадачи определения неизвестного факта, наиболее важного в данный момент и определение степени завершенности вывода по каждому возможному ответу.

В процессе преобразования правил экспертной системы в нейронную сеть первым этапом является разбиение каждого правила на элементарные операции дизъюнкции, конъюнкции и инверсии. Каждой такой операции назначается группа из нескольких нейронов. Каждая такая группа нейронов является элементарной операцией, выполняемой правилом экспертной системы. Группы нейронов связаны с другими группами посредством дендритов и аксонов. В каждой группе существует один главный нейрон, значение, на выходе которого является значением операции, выполняемой группой. Остальные нейроны группы выполняют служебные функции, такие как управление вниманием. Обработка такого формализованного представления текста в виде нейронной сети будет производиться собственными средствами нейронной сети. Следовательно, формализованное представление текста в виде нейронной сети обладает свойством самовыполнимости.