Шрифт:
Интервал:
Закладка:
Восприятие – ключевой аспект ИИ. Без способности воспринимать внешний мир ИИ может жить только в цифровой вселенной, имея свои, понятные лишь посвященным, «мысли» о данных, которые не имеют никакого отношения к реальности. Сенсоры соединяют его с внешним миром, камеры дают ему зрение, микрофоны – слух, датчики давления обеспечивают управление, акселерометры – ориентацию. За последние годы удалось разработать также много экзотических типов сенсоров, часто используемых в науке и технике. Это означает, что ИИ может обладать гораздо более широким спектром чувств по сравнению с нами. Например, большинство автономных транспортных средств используют систему LIDAR для обнаружения объектов и их местоположения вне зависимости от уровня освещенности. Камеры способны видеть области электромагнитного спектра, которые не доступны нашим глазам, позволяя, таким образом, ИИ видеть тепловые или радиоволны. Сенсоры, встроенные в двигатели, обеспечивающие GPS и триангуляцию через вышки сотовой связи и сигналы Wi-Fi, помогают ИИ точно определять свое местоположение и скорость. И хотя роботам не нужно есть, их химические сенсоры могут более точно распознавать химические вещества, чем наш нос или язык.
Сенсоры чрезвычайно важны, но они позволяют сделать лишь первый шаг в восприятии. Характеристики внешнего мира фиксируются этими датчиками, вырабатывающими электрические сигналы. А те уже преобразуются в данные – миллионы единиц и нулей, – поступающие в ИИ. Точно так же, как наш мозг преобразовывает сигналы от фотонов, попадающих на сетчатку в задней части наших глаз, и распознает их, ИИ понимает данные, непрерывно поступающие в его цифровой мозг.
Есть компания по производству рубашек, которая также производит датчики, встраиваемые в вашу одежду. Они будут следить за тем, как вы сидите, бегаете или катаетесь на лыжах, и генерировать данные на основе этой информации.
Ранние работы о компьютерном зрении были сосредоточены на разбивке изображений на составные элементы – предполагалось, что сходным образом видят наши глаза. Разрабатывались алгоритмы, которые исследовали массу, казалось бы, несвязанной информации, и в итоге удалось установить, что между областями на изображениях есть границы, или края.
В дополнение к обнаружению границ в компьютерном зрении создано множество умных алгоритмов для нахождения геометрических фигур и последующего сегментирования изображений на четко разграниченные области. Алгоритмы разрабатывались для определения расстояний с помощью стереоскопических камер, отслеживания движущихся объектов и построения трехмерных моделей из нескольких изображений, снятых под разными углами. Затем использовались статистические методы и методы идентификации лиц путем создания набора «усредненных характеристик лица» (базовых изображений, или характерных лиц).
Все эти методы были очень продвинутыми и позволяли роботам перемещаться с гораздо большей уверенностью, поскольку ИИ теперь могли распознавать простые формы и отслеживать их местонахождение. Подобные методы также положили начало распознаванию рукописного ввода и речи роботами. Но большинство подходов по-прежнему работали плохо в условиях неподходящего освещения или когда с датчиков поступали неидеальные данные – очень распространенный случай. Нужно было придумать что-то получше.
ОПРЕДЕЛЕНИЕ ГРАНИЦ КЭННИ
Один из наиболее популярных и часто используемых методов выявления границ в компьютерном зрении создал Джон Кэнни. Его метод основан на трех принципах:
1. Хорошее обнаружение – должны быть найдены реальные границы, а ложные или неправильные сведены к минимуму.
2. Хорошая локализация – должно быть верно определено расположение границ.
3. Правильное количество – каждая граница должна фиксироваться как одна граница.
Алгоритм Кэнни работает с изображением, сглаживая его, чтобы устранить любые помехи, которые могут привести к неправильному определению границ, а затем ищет резкие изменения в яркости. Каждый раз, когда одна область внезапно меняется по сравнению с другой, алгоритм детектирует местоположение, угол и степень изменения. Чтобы убрать слабые границы и оставить лишь сильные, применяются пороговые значения. Сомнительные границы отслеживаются: если они соединяются с более сильными, их стоит сохранить, если же нет – отбросить. В результате получается удивительно четкий набор границ, который можно извлечь практически из любого изображения.
Ответ нашелся в природе. В самом начале развития ИИ, когда такие исследователи, как Уоррен Мак-Каллок, Уолтер Питтс, Марвин Мински и Фрэнк Розенблатт, создали простое компьютерное моделирование нейронов, оно связывалось со стремлением дать компьютерам возможность учиться так же, как учатся мозги животных. Хотя самые ранние нейронные сети были слишком просты (как подчеркивает в своей книге Мински), исследователи продолжали совершенствовать методы их создания. Сама модель нейрона стала более сложной, и благодаря этому удалось разработать лучшие способы обучения нейронов.
Существует большой потенциал для использования технологий компьютерного зрения в конструктивном и благоприятном ключе.
Искусственные нейронные сети стали признанным и весьма успешным типом ИИ. Эти сети – очень упрощенные модели того, как работает биологический мозг. Большая часть сложных частей удалена – в них не происходит моделирования химических веществ, поддерживающих клетки, нет кровоснабжения и нейроны не передают друг другу электрические импульсы. А то, что остается, – это абстрактная идея искусственного нейрона, который ведет себя как математическая функция. Когда ему дают одно или несколько числовых значений на входе, он объединяет их с текущим состоянием и производит вычисление, используя математическую функцию, известную как функция активации.
МАРВИН МИНСКИ (1927–2016)
Мински известен как один из отцов ИИ, и на то есть веские причины. Один из основателей Дартмутской конференции по искусственному интеллекту, он помог назвать его и определить его область исследования, основав совместно с Джоном Маккарти знаменитую лабораторию ИИ в Массачусетском технологическом институте (МТИ). Мински изобрел конфокальный микроскоп и первый дисплей с возможностью установки на голове. В 1951 году он создал первую искусственную нейронную сеть – SNARC, которая включала в себя сорок нейронов. Мински продолжил свою работу в этой области, издав книгу «Перцептроны» в соавторстве с Сеймуром Пейпертом. Эта книга явилась фундаментальным достижением в анализе искусственных нейронных сетей, а также в ней подверглась критике работа Розенблатта. За свою жизнь Мински добился многочисленных и значительных успехов в области ИИ, в том числе благодаря своей теории «сообщества разума», в которой он предположил, что наш ум состоит из разнообразных агентов, работающих вместе. В дополнение к тому, что Мински удостоили многими наградами, его увековечили в фильме по роману Артура Кларка «2001 год: Космическая одиссея». После того как он выступил консультантом этого фильма Стэнли Кубрика, в его честь был назван персонаж – Виктор Камински.