Распознавание образов Печать

Вернуться к оглавлению

Распознавание образов - теория и принципы построения систем, способных различать предметы, явления и ситуации, группировать их в классы (образы).
pattern

Одна из удивительнейших способностей человека - способность узнавать. Увидев, мы узнаем, что перед нами корабль, бабочка, чашка, слон и т. п. Узнаем сразу и безошибочно, будь то сам оригинал или его уменьшенное или увеличенное изображение.

Удивляет нас не это свойство, наоборот - потерю его считают сверхъестественным, рассматривают как болезнь.

Мы живем в мире, окружающем нас различными образами - явлениями, предметами, ситуациями. И когда мы их воспринимаем, то обязательно разбиваем на группы похожих - классифицируем. Подчас в группе похожих оказываются очень разные, значительно отличающиеся один от другого предметы, но в чем-то они обязательно схожи, одинаковы.

Возьмем буквы алфавита. Каким бы трудным почерком ни были они написаны, мы всегда узнаем, что буква «у» - это буква «у», буква «д» это буква «д», буква «з» - это буква «з».

Или сопоставим такие разные рисунки, как, допустим, портрет человека, сделанный рукой мастера, и детский рисунок. При отличии увидим и сходство: и взрослый и ребенок изобразили человека.

Способностью узнавать человек обладает испокон веков. И все-таки до сего времени ученые в точности не знают, как же человек узнает. Как у него по едва уловимым признакам, зачастую неполным характеристикам складывается понятие образа? Того образа, который в восприятии окружающего мира, в процессах познания мира, раскрытия его тайн играет важнейшую роль.

Мы опять сталкиваемся с парадоксом, которых отнюдь не мало, когда речь заходит о загадках человеческого мозга, человеческой психики: не зная, как человек строит тип образа, ученые знают цену этой способности. Они утверждают, что восприятие явлений действительности в форме образов дает возможность более экономно использовать память. Ведь образ общих свойств класса явлений - освобождает нас от необходимости запоминать несчетное множество конкретных предметов, явлений. Образ помогает нам пользоваться накопленным ранее опытом.

Ученые весьма авторитетно говорят, что, не обладая способностью группировать объекты в образы, мы становились бы в тупик перед каждым новым явлением (совсем как вычислительная электронная машина). Ведь ни один предмет, ни одно явление никогда не бывает точным повторением, точной копией встречавшихся нам ранее.

Чем же обусловливается наша способность узнавать? Обучением. Обучаясь, накапливая опыт, человек классифицирует виденное, распознает образы.

А нельзя ли научить вычислительные машины моделировать процесс распознавания образов? Ученые отвечают: «Принципиальная разрешимость задач распознавания образов вытекает из наличия способности распознавания образов у человека и других живых организмов. В живой природе способность классифицировать сложные ситуации при обретается обучением, поэтому целесообразно использовать принцип обучения для создания классифицирующих автоматов. Их, оказывается, возможно создать даже в тех случаях, когда конструктору заранее не известны признаки, лежащие в основе классификации, но он располагает достаточным числом примеров отнесения ситуации к определенному классу».

Исследователи стали искать пути, как воплотить интересные идеи на практике.
С легкой руки американского кибернетика Ф. Розенблата, создавшего один из таких первенцев, подобные машины стали называть персептронами.

Персептрон. Экран персептрона - искусственная сетчатка из сотен фотоэлементов. Экран воспринимает образ.

Электрические сигналы, порожденные в сетчатке при восприятии образа, идут к нейронам с усилением - электронным элементам, моделирующим нервную ячейку. Их называют ассоциирующей системой - это ячейки памяти. Сигналы от нейронов с усилением идут в реагирующие устройства - на выход. А от специального устройства идут сигналы «наказания». Такова принципиальная схема персептрона.

Перед экраном поочередно ставят несколько букв. Естественно, они разных начертаний. Но машина узнает их, уверенно отличает «а» от «б», «б» от «в» - любую букву от любой другой.

Вначале персептрон часто ошибался, и тогда его «наказывали»: оператор нажимал кнопку «наказание», и сигналы, поступавшие в ячейки памяти, порожденные неправильным ответом, ослаблялись. Затем машине снова показывали фигуры и снова оценивали ответ. И когда все сигналы собирались на «совет», то у «провинившихся» было меньше голосов.

Так машина на собственных ошибках училась распознавать образы. Специалисты, оценивая сейчас идею создания персептронов, подчеркивают ее привлекательность. Ведь при обработке информации в символьной форме машина как бы вычленяет из интеллектуального процесса только алгебраическую составляющую.

Машина, узнающая образ, картину, добавит еще и геометрическую. Потому-то как ни трудна эта зада а для реализации в широких масштабах, над ней продолжают работать.

И в персептроне, и в машине, работающей по принципу компактных множеств, используют прием контрастности: фон освещают слабее, очертания предметов делают резкими или наоборот - светлее очертания, темнее фон. Телекамеры вводят изображение в машину, та анализирует образы по границам контуров, а контуры сравнивает с образами, хранящимися в памяти.

Однако такой прием не совершенен из-за повышенной чувствительности устройств к изменениям освещенности окружающего пространства. Так, одна система, наученная распознавать образы, тут же теряла свою способность, когда в помещение входил посторонний человек. Выяснилось, что систему сбивал с толку избыточный поток света, отражаемый белой рубашкой нежеланного посетителя.

Эту трудность пытались и пытаются сейчас обойти. Но к сожалению, успехи здесь не столь велики.

Правда, в последние годы появилась компьютерная программа, которая, как надеются ее авторы, сделает компьютер умеющей распознавать различные объекты в различном окружении.

Эта программа под силу машине со сложной сетью из множества элементарных блоков типа реле. Каждый блок, находясь в одном из двух состояний - включенном или выключенном,- соединен по меньшей мере с тысячью себе подобных. Изображение предмета - определенное состояние сети. Допустим, образ слона включает одни блоки и выключает другие, а образ пингвина - другая комбинация включений и выключений. Так образуется «внутренний мир» предполагаемой машине, ее «распределенная» память. Считают, что она более пригодна для целей распознавания образов, нежели старая, когда каждый блок несет определенную запись. Мало того, предполагают, что память человека организована каким-то близким образом.

Для распознавания образов стараются привлечь и возможности голографии. С ее помощью «зрение» машин пробуют сделать не двухмерным (светлее - темнее), а трехмерным. К характеристикам яркости объекта прибавляются данные о расстоянии: каждая точка голограммы содержит информацию о расстоянии до соответствующей точки объекта и о ее яркости.

Добавочная третья характеристика, позволяющая перейти от распознавания плоскостных образов к объемным, как бы приближает возможности машин к жизненной реальности. У них появляется способность анализировать не только, допустим, документы, чертежи, фотографии, но и объемные предметы, ориентироваться в помещении. И когда специалисты ставят задачу распознавания трехмерных образов, они говорят о распознавании сцен и связывают с ним наиболее перспективные и актуальные исследования.

Решить проблему распознавания образов - это не только найти ответ на интереснейшую теоретическую головоломку, но и решить задачу большого практического значения.