litbaza книги онлайнРазная литератураНеоконченная симфония Дарвина: Как культура формировала человеческий разум - Кевин Лейланд

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 17 18 19 20 21 22 23 24 25 ... 133
Перейти на страницу:
значение, чем полученным какое-то время назад{293}.

Лучшие из представленных на турнире стратегий ограничивали объемы научения, чтобы гарантированно поддерживать высокую окупаемость предлагаемого поведения. ДИСКОНТ-АВТОМАТ выделялась на их фоне относительно равномерным распределением научения по всему жизненному сроку агента. Своим успехом эта стратегия отчасти обязана тому, что, в отличие от конкурентов, тратила меньше времени на ученичество и больше на практику, разыгрывая ПРИМЕНЯТЬ, что, в свою очередь, давало возможность агентам обучаться эффективнее соперников. Добивалась этого ДИСКОНТ-АВТОМАТ за счет оценки прогнозируемой отдачи либо от научения, используя ход НАБЛЮДАТЬ, либо от разыгрывания ПРИМЕНЯТЬ{294}. Иными словами, стратегия-победительница прибегала к своего рода мысленным путешествиям во времени: она оглядывалась на прошлое, всматривалась в будущее и на основании полученных данных вычисляла, какой ход будет оптимальным в каждом раунде.

Что поразительно, и ДИСКОНТ-АВТОМАТ, и занявшая второе место стратегия ИНТЕРПОКОЛЕНИЕ[10] едва ли не единственным вариантом научения выбирали поведенческую модель НАБЛЮДАТЬ. Да и во всех стратегиях, прошедших во второй этап, по крайней мере половина объема научения отводилась наблюдению. Мы задались вопросом, в какой мере успех ДИСКОНТА-АВТОМАТА на турнире обусловлен подражанием, и Люку пришел в голову оригинальный способ это выяснить. Отредактировав компьютерный код ДИСКОНТА-АВТОМАТА, он создал измененную его версию, совпадавшую с оригинальной во всем, кроме того, что вместо хода НАБЛЮДАТЬ в ней каждый раз предполагался ход НОВАТОРСТВОВАТЬ. После этого мы заново провели второй этап турнира (меле), выставив против «мутировавшей» версии ДИСКОНТА-АВТОМАТА девять других состязавшихся с ней стратегий в их неизменном виде. Если успех победительницы объясняется именно упором этой стратегии на подражание, рассуждали мы, то в повторных групповых боях она покажет себя хуже, чем первоначально. И напротив, если успех был больше связан с другими свойствами, она может вырваться вперед и в повторных схватках. К нашему изумлению, на этот раз ДИСКОНТ-АВТОМАТ с треском провалилась. Версия-мутант, умеющая только НОВАТОРСТВОВАТЬ, а не НАБЛЮДАТЬ, не просто показала результаты хуже достигнутых оригиналом, она заняла последнее место! А значит, своим успехом стратегия-лидер в немалой степени обязана именно ориентации на социальное научение.

Теперь у нас с Люком было две версии ДИСКОНТА-АВТОМАТА: одна – основанная почти полностью на социальном научении, а вторая – на несоциальном, – и мы осознали, что можно сравнить достоинства этих двух форм научения, сталкивая их в соперничестве друг с другом при широком разнообразии условий. Сходные попытки анализа предпринимались и прежде, но у исследователей не было ни такого умного алгоритма, ни такой насыщенной симулированной среды, и потому мы полагали, что наше исследование будет больше приближено к действительности, чем предшествующие. Результаты нас очень удивили – к такому мы совсем не были готовы: подражание одерживало над несоциальным научением сокрушительную победу практически при любых обстоятельствах. Так, например, манипулируя частотой перемен в окружающей среде, мы обнаружили, что «строго новаторская» версия ДИСКОНТА-АВТОМАТА сможет хотя бы немного утвердиться, только если окупаемость каждой поведенческой модели станет меняться в каждом раунде с вероятностью более 50 %. Иными словами, самостоятельное научение будет эффективнее научения у других лишь в экстремально суровой среде, которая трансформируется с головокружительной скоростью – настолько стремительно, что в природе такие условия, скорее всего, почти не встречаются.

Эти открытия шли вразрез со всеми нашими прежними знаниями и многими интуитивными догадками. В частности, среди психологов было распространено убеждение, что подражание окупается, поскольку позволяет индивиду одновременно рассмотреть поведение большого количества других себе подобных{295}. Быстрый обзор поведения множества индивидов позволяет ученику применять такие стратегии, как подстройка под большинство, на которой основана предположительно значительная часть научения у человека{296}. Но благодаря турниру мы обнаружили, что при разыгрывании модели НАБЛЮДАТЬ можно уменьшить число объектов подражания до одного и оно все равно окупится, то есть оригинальная версия ДИСКОНТА-АВТОМАТА одерживала верх над исправленной; да и в меле тоже, собственно, побеждали стратегии с упором на подражание.

Экономисты часто называют причиной выигрышности социального научения возможность индивидов отслеживать отдачу, получаемую другими, и перенимать высокоокупаемое поведение. Однако наши симуляторы показали, что можно взвинтить частотность ошибок, связанных с оценкой окупаемости наблюдаемого поведения, до такого уровня, при котором подражатель в принципе не будет получать достоверных сведений об отдаче, и тем не менее стратегии, полагающиеся в основном на выбор НАБЛЮДАТЬ, все равно опередят конкурентов.

Кроме того, многие исследователи социального научения, включая и меня, полагали крупным его недостатком то, что при подражании неизбежно возникают ошибки копирования – когда индивиды перенимают неверное поведение или когда им вообще не удается что-либо перенять. Однако оказалось, что даже при очень высоком проценте ошибок, если в 50, 60, 70 % случаев разыгрывания НАБЛЮДАТЬ репертуар агента не пополнялся новым, более окупаемым поведением, подражание, как это ни поразительно, все равно оказывалось выгодно.

В чем же сила подражания? Почему в самых разнообразных условиях социальное научение торжествует над несоциальным? Турнир принес нам на этот счет очень важное открытие: подражание окупается, поскольку те, кому подражают, отфильтровывают свое поведение и предоставляют в распоряжение копировщиков адаптивную информацию. Участники турнира задавали в своих стратегиях условие, по которому агенты должны были сначала накопить поведенческий репертуар, а потом использовать выученное поведение, увязываемое с наивысшей отдачей. Однако это значит, что, разыгрывая ПРИМЕНЯТЬ, агенты следовали не случайной модели поведения, а отобранной, проверенной, высокоокупаемой. Соответственно, разыгрывающие НАБЛЮДАТЬ черпали из того же кладезя высокоокупаемых вариантов, поскольку применялись именно они. При разыгрывании НАБЛЮДАТЬ шансов усвоить поведение с очень высокой отдачей оказывалось гораздо больше, чем при разыгрывании НОВАТОРСТВОВАТЬ, поскольку в последнем случае в «копилку» добавляется поведение случайное и преимущественно малоокупаемое. В наших тестовых симуляциях, в которых агенты, разыгрывающие ПРИМЕНЯТЬ, выбирали из своего репертуара поведенческих моделей наугад, а не лучшую из имеющихся вариантов, «строго новаторская» версия ДИСКОНТА-АВТОМАТА одерживала верх над оригинальной. Фактор, объясняющий, почему социальное научение оказывается таким выгодным для подражателя, – избирательный подход объектов подражания к своему поведению.

Вот почему имеет смысл подражать. Вот почему мы наблюдаем подражание не только у животных с крупным мозгом, как у человека, шимпанзе, японских макак, но и у дрозофил и сверчков. Чтобы получать выгоду от подражания, животному необязательно быть умным, поскольку за него уже поразмышлял коллективный разум – объекты подражания, отфильтровавшие для него нужный вариант реакций и действий. Мы, исследователи социального поведения, сосредоточившись на том, что требуется сделать особи-наблюдателю, чтобы усвоить адаптивную информацию, совершенно упустили из виду, насколько облегчают подражателю задачу сами объекты подражания. Во многих обстоятельствах копирование, даже подчиняющееся относительно простым правилам, гораздо вероятнее приведет к высокоокупаемому поведению, чем метод проб и ошибок. Именно поэтому подражание так распространено в природе.

Не только эти представления заставил пересмотреть наш турнир. Согласно прогнозам прежних аналитических исследований, таких как модель Роджерса, эволюция должна приводить к устойчивому равновесию, при котором в популяции сохранится и социальное, и несоциальное научение{297}. Однако когда мы свели в поединке две версии ДИСКОНТА-АВТОМАТА, в большинстве симулируемых обстоятельств оригинал шутя переигрывал версию с несоциальным научением. В прежних исследованиях социальные ученики моделировались как настороженные по отношению ко всему новому, упорно придерживавшиеся отработанного поведения даже при смене условий среды. Такая установка не могла не сказаться на предполагаемой приспособленности социального научения: ведь, подражая этим чурающимся перемен особям, ученики усваивали далекое от оптимального поведение. На турнире же агенты накапливали поведенческий репертуар, которым могли пользоваться гибко. В зависимости от изменений в окружающей среде успешные стратегии, такие как ДИСКОНТ-АВТОМАТ, не придерживались утратившего актуальность поведения, а переключались на следующий в рейтинге окупаемости паттерн из своего репертуара. Соответственно, когда агенты разыгрывали ПРИМЕНЯТЬ, другие агенты – подражатели, разыгрывающие НАБЛЮДАТЬ, – перенимали у них весьма высоко окупаемое поведение. В отличие от модели Роджерса здесь агенты не были связаны с несоциальными учениками частотно-зависимыми взаимоотношениями, не дающими им иного способа отслеживать перемены в окружающей среде. При условии небольшого количества ошибок копирования разыгрывание НАБЛЮДАТЬ вызовет достаточно разнообразное поведение, обеспечивающее социальным ученикам адаптивный отклик на перемены в окружающей среде.

Из более ранних теоретических работ следовало, что упор на социальное научение не всегда повышает среднюю приспособленность особей в популяции{298} и может даже снизить ее{299}, подтверждая тем самым парадокс Роджерса. Турнир показал путь к преодолению явного несоответствия

1 ... 17 18 19 20 21 22 23 24 25 ... 133
Перейти на страницу:

Комментарии
Минимальная длина комментария - 20 знаков. Уважайте себя и других!
Комментариев еще нет. Хотите быть первым?