Шрифт:
Интервал:
Закладка:
Как мы распознаем образ? Узнаем ли мы собаку потому, что сначала увидели ее шерсть, четыре ноги, глаза, уши и т. д., — или мы узнаем эти составляющие потому, что сначала увидели собаку? Эта проблема — начинается ли распознавание с частей паттерна, которые служат только основанием для распознавания целого (обработка «снизу вверх»), или же оно начинается с выдвижения гипотезы о целом, которая позволяет его идентифицировать, а потом мы опознаем его составные части (обработка «сверху вниз») — называется аналитическим парадоксом. (Термины «снизу вверх» и «сверху вниз» заимствованы из компьютерной лексики.) Некоторые теоретики, например Палмер (Palmer, 1975a), предположили, что при определенных обстоятельствах опознание частей и целого может происходить одновременно в направлении снизу вверх и сверху вниз. В качестве примера взаимодействия стратегий «от частного к общему» и «от общего к частному» Палмер приводит опознание частей лица в контексте и без такового. Как видно из рис. 4.8, части лица, легко опознаваемые в контексте, выглядят неоднозначно, если стоят отдельно, но становятся узнаваемыми при более подробном изображении или когда снабжены дополнительной информацией.
Рис. 4.8. Черты лица, опознаваемые в контексте всего профиля (а), вне контекста опознать труднее (б). Однако если эти черты изобразить более полно и реалистично (е), они опознаются легче. Источник: Palmer, 1975a
В различных контекстах мы ожидаем увидеть определенные объекты. В кабинете врача мы обнаруживаем стетоскоп, на кухне — столовое серебро, в офисе — компьютер, а на улице — пожарный кран. Похоже, что это «знание о мире» каким-то образом облегчает идентификацию объектов в знакомых контекстах и мешает их идентификации в неподходящих. Несколько исследований «влияния контекста», проведенных Бидерманом и его сотрудниками (Biederman, 1972; Biederman, Glass & Stacy, 1973; см. также раздел «Теория геонов» далее в этой главе), показали, что когда испытуемые ищут объект в сценах из реального мира (например, объекты в своем институте или на улице), то точность опознания и требуемое для идентификации время зависят от соответствия объекта его положению в данной сцене.
Из этих и других аналогичных исследований, касавшихся идентификации букв и слов, ясно, что на восприятие объекта значительно влияют ожидания человека, задаваемые контекстом.
Одна из гипотез, касающаяся распознавания паттернов и форм, называется «сравнение с эталоном». В нашем случае распознавания паттернов человеком эталон — это некоторая внутренняя структура, которая при сопоставлении с сенсорными стимулами позволяет опознать объект. Согласно этому представлению о распознавании, в процессе приобретения жизненного опыта у нас образуется огромное количество эталонов, каждый из которых связан с некоторым значением. Так, зрительное опознание формы, например геометрической фигуры, происходит следующим образом: световая энергия, исходящая от этой фигуры, воздействует на сетчатку глаза и преобразуется в нервную энергию, которая передается в мозг. Среди имеющихся эталонов осуществляется поиск. Если находится эталон, соответствующий нервному паттерну, человек опознает этот паттерн. После сопоставления объекта с его эталоном может происходить дальнейшая обработка информации и интерпретация объекта.
Критические размышления: распознавание паттернов
Распознавание паттернов
Посмотрите на объекты, изображенные на этих рисунках. Какие два похожи друг на друга? Как вы пришли к такому выводу? Какие факторы повлияли на ваше решение? Для дальнейших размышлений ознакомьтесь с темами сравнения с эталоном, предварительной подготовки и подетального анализа.
Сравнение с эталоном как одна из теорий распознавания паттернов имеет свои сильные и слабые стороны. С одной стороны, кажется очевидным, что для опознания некоторой фигуры, например буквы или какой-нибудь визуальной формы, нужен определенный контакт с соответствующей внутренней формой. На каком-то уровне абстракции для опознания объекта «внешней реальности» необходимо, чтобы он был представлен в долговременной памяти. С другой стороны, буквальная интерпретация теории сравнения с эталоном сопровождается определенными трудностями. Например, если опознание возможно только тогда, когда между «внешним» объектом и его «внутренней» репрезентацией имеется соответствие 1:1, это значит, что даже при незначительном расхождении между объектом и его эталоном опознания не произойдет. Поэтому строгое следование этой теории означало бы необходимость формирования несчетного количества эталонов, соответствующих каждой из разнообразных геометрических форм, которые мы видим и узнаем.
Поразительная многосторонность восприятия формы человеком
Здесь показаны разные буквы, в которых вы легко узнаете вариации буквы А Однако маловероятно, что вы видели и сформировали в памяти точные копии всех этих вариантов. Мы можем выполнить эту и многие другие подобные задачи на распознавание паттернов, потому что уже сформировали образы различных классов объектов, например буквы А и способны применить эту информацию к широкому классу подобных форм.
Легкость, с которой мы распознаем зрительные образы в повседневной жизни, может навести на мысль, что этот процесс очень прост, и все же, когда мы пытаемся воспроизвести опознание с помощью искусственных средств, оказывается, что результат от нас ускользает. Возьмем для примера опознание букв и устройство для распознавания слов. Чтобы научиться хорошо читать, нужно потратить несколько лет, но, научившись распознавать орфографическую конфигурацию, составляющую слово, мы можем мгновенно узнать это слово в различных контекстах, произнести его и вспомнить его значение. Как бы вы смоделировали исходный процесс опознания буквы на компьютере? Один из способов — хранить в «памяти» компьютера каждую из букв алфавита. Тогда каждый раз при сканировании буквы оптическим устройством воспринимаемая зрительная конфигурация «настраивалась» бы на элемент памяти (эталон), связанный с этой буквой. Так, слово CARD (карточка) анализировалось бы как C-A-R-D, то есть С настраивалось бы на ячейку памяти, соответствующую конфигурации С, для А нашлось бы соответствие в ячейке А и т. д. «Вуаля! — мог бы воскликнуть компьютер. — А я читаю буквы!» Но что если бы мы попросили его опознать буквы в слове card? В его памяти нет конфигураций для написания букв в нижнем регистре. Решение просто, скажете вы: увеличьте память и включите туда буквы нижнего регистра. Но тогда мог бы наш компьютер прочитать (как это делаем мы) буквы, написанные вот так:или так:, или так:, или так:?