Шрифт:
Интервал:
Закладка:
Рецептивные поля нейронов ЛКТ – это маленькие кружки на рисунке слева. Аксоны клеток ЛКТ сходятся в одном нейроне первичной зрительной коры. Одни из них идут от on-клеток и являются возбуждающими (обозначены плюсом); другие – от off-клеток и являются тормозящими (обозначены минусом). Если сетчатка стимулируется краем, точно ориентированным под соответствующим углом (рисунок справа), все возбуждающие входы активируются, а все тормозящие молчат.
Корковый нейрон имеет вытянутое рецептивное поле с областью возбуждения, граничащей с областью торможения. Оптимальный стимул для этой клетки показан на рисунке справа: светлая область, граничащая с темной. Именно это мы и называем ориентированным краем. На светлой стороне края входы четырех нейронов ЛКТ суммируются, когда край имеет соответствующую ориентацию.
Как уже не раз отмечалось, линии и края очень важны, поскольку они являются доминирующими носителями информации о естественной визуальной среде. Это объясняется тем, что наш мир состоит из объектов, а края объектов определяют их границы, отделяя от всего остального. Иногда края бывают прямыми, как стволы деревьев; иногда изогнутыми, как у камней, но кривая – это просто набор крошечных прямых линий. Таким образом, информация о краях составляет значительную часть общего ввода в зрительную систему мозга, что неизбежно влияет на организацию ее синаптических связей.
Нам уже известен механизм, посредством которого нейронная сеть, обучаемая на примерах из естественного мира, может трансформировать ввод от круглых неориентированных рецептивных полей в чувствительные к линиям элементы – то есть создавать «простые» корковые клетки. Представим группу клеток ЛКТ, сходящихся в нейроне V1. Когда четыре расположенные в ряд клетки ЛКТ стимулируются краем соответствующей ориентации, они одновременно возбуждаются и вызывают возбуждение своего коркового нейрона. Это приводит к усилению синаптических связей между этой линией клеток ЛКТ и нейроном-мишенью – и, как следствие, к относительному ослаблению связей этого нейрона с другими клетками ЛКТ.
Описанный механизм был протестирован много лет назад на искусственной нейронной сети, которую обучали путем простой демонстрации большого количества изображений естественного мира (это был случай так называемого обучения без учителя). Последующий анализ выходного слоя сети показал, что она научилась распознавать прямые линии – то есть в процессе обучения компьютер создал свою версию простых клеток. Это неудивительно: поскольку видимый мир непохож на случайно снежащий телеэкран, практически любая зрительная система – естественная или искусственная – уже на ранней стадии будет включать функцию обнаружения краев.
ЗРИТЕЛЬНАЯ ЗОНА КОРЫ V2: СЛОЖНЫЕ КЛЕТКИ
Сложные клетки, как и их простые собратья, избирательны в отношении ориентации, но имеют более обширное рецептивное поле и, как следствие, менее привязаны к точному положению ориентированного края в пространстве. Можно сказать, что эти клетки выполняют базовую форму генерализации: они выделяют общий признак – край определенной ориентации, абстрагируясь от конкретного набора зрительных пикселей, стимулируемых на сетчатке.
Предположительно сложная клетка создается так же, как и простая: посредством конвергенции нейронов предыдущего уровня, в данном случае простых клеток, в нейроне более высокого уровня. Каждая простая клетка чувствительна к ориентированному краю, находящемуся в строго определенном месте поля обзора. Схождение множества простых клеток с ограниченными локальными полями в одном нейроне создает сложную клетку, которая реагирует на край данной ориентации на всем пространстве их общего рецептивного поля.
Сложные клетки сосредоточены в зрительной зоне V2, но также присутствуют и в первичной зрительной коре V1. Поэтому сделанное мной здесь разделение призвано всего лишь подчеркнуть тот факт, что сложные клетки, судя по всему, создаются путем иерархической конвергенции простых клеток, как это предположили Хьюбел и Визель. Этот используемый мозгом способ создания сложных клеток из простых лег в основу одной из ведущих современных форм машинного обучения.
ЗРИТЕЛЬНЫЕ ЗОНЫ КОРЫ V3 И V4
Многочисленность и разнообразие связей между зонами V1, V2, V3 и V4 не позволяет рассматривать их как жестко обособленные анатомические структуры, а также затрудняет понимание того, каким образом происходит формирование последующих рецептивных полей из предыдущих. Скорее речь идет о сетеобразной структуре.
Изучение активности нейронов в зонах V3 и V4 показывает, что те реагируют на различные признаки. Один из достаточно хорошо изученных – кривизна. Первоначально эти клетки были описаны Хьюбелом и Визелем как клетки, реагирующие на концы линий (end-stopped cells). Эти клетки чем-то похожи на сложные клетки – предполагается, что они создаются посредством иерархической конвергенции сложных клеток, – но обладают дополнительным свойством: они предпочитают не просто края, а края определенной, фиксированной длины. Однако последующие исследования показали, что это свойство также можно рассматривать как чувствительность к кривизне. Помимо них в зонах V3 и V4 содержатся клетки с другими специфическими видами чувствительности: так, некоторые клетки в V4 чувствительны к цветам, а в V2 есть клетки, чувствительные к углам. Честно говоря, ученые пока имеют весьма смутное представление о том, что происходит внутри этих зрительных зон.
По аналогии с искусственными нейронными сетями зоны V1, V2, V3 и V4 могут функционировать как промежуточные «скрытые слои» зрительной сети. Именно это может объяснять, почему поведение их нейронов – несмотря на все усилия исследователей – так трудно классифицировать. Как мы увидели в главе 10, скрытые слои последовательно соединяют несколько нейронных сетей, таким образом значительно увеличивая их вычислительную мощь. Они называются «скрытыми», потому что не взаимодействуют напрямую с внешним миром, а только с соседними слоями. Понять, что делают эти скрытые слои, нелегко даже в собственноручно сотворенных нами системах ИИ. Ситуация осложняется тем, что нейроны в одном скрытом слое необязательно должны делать одно и то же. Да, у нас есть основания полагать, что нейроны в зонах V3 и V4 выполняют более сложные функции по выделению признаков, чем клетки в зонах V1 и V2. Можно сказать, что по своей сложности функции этих скрытых слоев находятся в промежутке между функциями зон V1 и V2 и функциями областей распознавания объектов в височной коре.
ВИСОЧНАЯ КОРА
Если не вдаваться в детали, обработка зрительной информации в височной коре построена по иерархическому принципу в направлении от задней к передней части коры: более простые признаки выделяются в задней части, ближе к первичной зрительной коре V1, а распознавание сложных объектов происходит ближе к передней части (лобной доле мозга). Разумеется, это сильно упрощенное представление (вспомните вышеприведенную анатомическую «коммутационную схему» с ее паутиной прямых и обратных связей), но достаточно близкое к реальности, чтобы быть полезным для понимания системы обработки изображений в мозге.