Шрифт:
Интервал:
Закладка:
Компьютерное распознавание сложных форм применяется на практике в области распознавания лиц. Предположим, что ваше лицо имеет уникальные признаки, такие же, как отпечатки пальцев. Компьютерная система, которая может сканировать лицо человека и найти полное соответствие с ним, могла бы очень помочь в работе полиции. Она также оказалась бы полезной для идентификации чеков и в системах безопасности промышленных объектов и офисов. Представьте, что каждое утро на работе вас приветствует компьютер, который просит: «Пожалуйста, расположите ваше лицо так, чтобы я мог его увидеть», — а после его сканирования и открытия двери говорит: «Здравствуйте, госпожа Джуэль, вам звонил В. М. Бич... и, между прочим, с днем рождения». Хотя вы можете воспринять это как еще одно вторжение в вашу личную жизнь, вероятно, что довольно скоро нам придется смириться с такими устройствами.
Исследование идентификации лиц было проведено специалистами по компьютерам Томасом Поджо и Роберто Брунелли в Массачусетском технологическом институте. Суть программы состояла в определении и математическом анализе существенных признаков лиц, таких как ширина носа, расстояние между глазами и подбородком и т. д. Были выявлены шестнадцать признаков (рис. 16.6).
Рис. 16.6. Сравнение лиц. Чтобы это лицо соответствовало лицу в памяти компьютера, для установления сходства собраны и используются в формуле шестнадцать таких ключевых признаков, как глаза, нос и размеры подбородка. Данная формула основана на измерении евклидового расстояния в шестнадцатимерном пространстве. Эту работу ведут в Массачусетском технологическом институте Р. Брунелли и Т. Поджо
Если бы лица не менялись, было бы достаточно простой модели сравнения с эталоном; однако наши лица никогда не бывают одинаковыми. Поэтому программа должна найти близкое сходство между вашим лицом сегодня и вашим лицом на прошлой неделе, но при этом не быть слишком снисходительной, чтобы пропустить самозванца. Программа делает это путем геометрического сравнения различных аспектов признаков и обещает быть намного более надежной, чем идентификация лиц, осуществляемая людьми. Такое устройство могло бы помочь разгадать некоторые фотографические тайны, неожиданно возникающие время от времени (например, находка очень ранней фотографии человека, который может быть (или не быть?) Авраамом Линкольном).
Может ли этот человек быть Авраамом Линкольном?
Эта сделанная в начале XIX века фотография молодого человека, похожего на Линкольна, но он ли это? Компьютерный анализ лицевых признаков может помочь дать ответ на этот вопрос.
Из нашего обсуждения распознавания объекта (см. главу 4) мы знаем, что восприятие паттернов человеком связано не только с наблюдением объекта и последующим сопоставлением этого образа с эталоном в мозге (подобно тому, как компьютерные коды вертикальных полос сравниваются с соответствующими паттернами). Вполне возможно, что оно происходит на основе ранее сохраненных признаков, которые при объединении образуют прототип. Новые или менее знакомые стимулы распознаются дольше старых или знакомых паттернов, потому что совпадений между паттерном и хранящейся в памяти информацией обнаруживается гораздо меньше. Компьютеры не имеют ограничений на объем хранящейся информации — практически нет предела объема памяти компьютеров, — поэтому при написании программ часто предполагалось использование большого хранилища информации и механизмов поиска при сравнении образов восприятия с воспоминаниями. В «реальной жизни» мы узнаем людей, места и даже слова без особых усилий не потому, что каждый раз, когда мы видим эти объекты, то сохраняем эти образы отдельно друг от друга, а потому, что сохраняем абстракцию, связанную с этим классом стимулов. Так, когда вы узнаете свои спальню, подушку и ботинки, это происходит потому, что мозг сохранил «идеальные», а не фотографические образы.
Синха и Поджо (Sinha & Poggio, 1997) продемонстрировали важность формы головы при распознавании лиц людьми и компьютерами. Мы знаем друг друга, потому что знакомы месяцы и годы. Лицевые характеристики хранятся в памяти, и, когда мы видим человека, у которого присутствуют все признаки его лица-прототипа, мы сразу узнаем «оригинал». Этот процесс мало чем отличается от описанного в эксперименте Солсо и Мак-Карти опыта с лицами-прототипами (см. главу 4). В эксперименте Синха и Поджо предъявлялись лица, показанные на рис. 16.7.
Рис. 16.7. Вы можете быстро идентифицировать эту известную пару? Вы уверены? Объяснения в тексте
На первый взгляд эта пара напоминает бывшего президента Билла Клинтона и вице-президента Альберта Гора, но в действительности лицо на заднем плане составлено из основных признаков лица президента Клинтона — его глаз, носа и рта, — добавленных к образу Гора — его волосам, ушам и телу. Вероятно, эта иллюзия сначала ввела вас в заблуждение потому, что у вас была «установка»: эти люди образуют «пару». Даже положение, занимаемое на рисунке каждым из изображенных, повлияло на ваше восприятие, а затем вы увидели волосы Гора, его тело, его осанку и быстро приняли решение. Таким образом, на распознавание паттерна оказывает большое влияние прошлое восприятие, которое в случае узнавших Гора оказалось неэффективным. Из исследований, проведенных Поджо и его коллегами, можно сделать два вывода. С одной стороны, можно разработать программы, которые распознают объекты и лица лучше, чем люди (и такие устройства полезны в работе правоохранительных органов). С другой стороны, можно создать программу научения так, чтобы компьютер мог методом проб и ошибок научиться распознавать объекты и лица намного лучше, чем люди.
Системы, которые работают как люди-эксперты, называют экспертными системами. По существу, экспертная система — это искусственный специалист, который решает проблемы в области своей компетенции. Экспертные системы были разработаны, чтобы решать задачи в медицине, юриспруденции, аэродинамике, шахматах и освободить людей от несметного числа рядовых процедур, которые обычно надоедают людям или в некоторых случаях могут быть слишком трудны для решения людьми (см. только что обсуждавшуюся тему идентификации лиц). Эти системы хорошо подчиняются правилам. Они могут «обдумывать» только одну проблему. Экспертная система в медицине может быть незнакома с гражданскими правонарушениями, но она может поставить довольно точный диагноз тринадцатилетней девочке с высокой температурой, болью в животе и повышением уровня лейкоцитов в крови. Одна такая программа, неудачно названная Puff[108], является экспертной системой, разработанной для диагностики болезней легких, например рака легких; ученые заявляют, что точность ее работы приблизительно равна 89%, — близко к точности диагноза, поставленного опытными врачами. Эти системы особенно популярны в промышленности, армии и в исследованиях космоса. Они довольно хорошо справляются со своей работой. Кроме того, они не бастуют и не требуют больше денег, не возражают, чтобы их разбили вдребезги, не требуют средств для поддержания жизни и их очень любят тупицы.