Шрифт:
Интервал:
Закладка:
263
Kameda and Nakanishi 2002.
264
Из более поздних теоретических работ следует, что этот вывод подтверждается не всегда и существует ряд обстоятельств, при которых социальное научение и несоциальное в состоянии равновесия обеспечивают неодинаковую приспособленность (Boyd and Richerson 1985; van der Post and Hogeweg 2009; Rendell et al. 2010; Rendell, Boyd, et al. 2011).
265
Rogers 1988.
266
Стратегия будет эволюционно стабильной, если она применяется всей популяцией и не вытесняется какой-либо другой стратегией, изначально редкой.
267
Giraldeau et al. 2002, Henrich and McElreath 2003.
268
Boyd and Richerson 1985.
269
Tellier 2009.
270
Caselli et al. 2005.
271
Этот вывод подтверждается теоретическими моделями, исследующими другие варианты стратегического подражания, – например, предполагающий использовать подражание только тогда, когда не срабатывает несоциальное научение, или подражать пропорционально отдаче, получаемой объектами копирования, – из чего следует, что подражание дает больше преимуществ для адаптивности, чем несоциальное научение (см.: Boyd and Richerson 1995, Laland 2004, and Enquist et al. 2007).
272
Boyd and Richerson 1985, Rogers 1988, Feldman et al. 1996, Giraldeau et al. 2002.
273
Boyd and Richerson 1985, Henrich and McElreath 2003, Laland 2004.
274
Laland 2004.
275
Там же.
276
Там же.
277
Henrich and McElreath 2003; Laland 2004; Kendal et al. 2005; Kendal et al. 2009; Rendell, Fogarty, Hoppitt, et al. 2011; Hoppitt and Laland 2013.
278
У нас есть косвенные свидетельства, согласующиеся со всеми этими (и не только этими) идеями, хотя такие данные (совокупность результатов наблюдений и экспериментов) обычно недостаточно подробны, чтобы подкрепить ими какую-либо отдельную стратегию. Чаще они согласуются с множеством альтернативных стратегий (Rendell, Fogarty, Hoppitt et al. 2011; and Hoppitt and Laland 2013).
279
См., например: Kendal et al. 2009.
280
Термин «оптимальная» заключен в кавычки, чтобы обозначить трудноуловимое различие между признаками, которые должны развиться при данных обстоятельствах, и оптимальными. В действительности большая часть теоретико-аналитических работ такого характера – например, основанных на эволюционной теории игр – направлена на поиск эволюционно-стабильных стратегий, которые вернее назвать «невытесняемыми», а не безоговорочно оптимальными (Maynard-Smith 1982).
281
Axelrod 1984.
282
Контракт Европейской комиссии FP6–2004-NESTPATH-043434.
283
Окупаемость определялась на основе экспоненциального распределения.
284
«Многорукий бандит», у которого окупаемость меняется с течением времени, называется «неугомонным». Эти неугомонные «многорукие бандиты» признаны серьезной проблемой, удовлетворительного аналитического решения которой пока не найдено (Papadimitriou and Tsitsiklis 1999).
285
Новое поведение выбиралось случайным образом.
286
Так называемый компромисс исследования-использования, когда выбор делается между исследованием нового и использованием известного.
287
Набор правил обозначался либо словесно, «псевдокодом», либо на языке программирования (Matlab).
288
Для этого мы организовали парные состязания, в которых поначалу все агенты популяции использовали одну стратегию, а затем появлялось небольшое число агентов, использующих альтернативную. После этого мы проверяли, может ли новая стратегия вытеснить исходную и закрепиться в популяции, победив в соперничестве с исходной. Стратегия, более эффективно обеспечивавшая высокоокупаемое поведение, в среднем воспроизводилась чаще альтернативной и начинала господствовать. Каждое парное состязание состояло из повторяющихся поединков на 10 000 раундов между двумя стратегиями, которые по очереди становились то исходными, то новоявленными. Мы учитывали среднюю встречаемость каждой стратегии в популяции в последних 2500 раундах каждого поединка и начисляли каждой стратегии баллы, представлявшие собой среднее значение этих показателей для количества поединков, в которых данные стратегии участвовали.
289
Привожу соотношение на момент состязания.
290
Полный список включает в себя антропологию, биологию, информатику, инженерное дело, экологию, этологию, междисциплинарные исследования, менеджмент, математику, философию, физику, приматологию, психологию, социологию и статистику.
291
Как и в турнире Аксельрода, родиной победившей стратегии оказалась Канада.
292
В групповом бое ДИСКОНТ-АВТОМАТ выиграла 35 % состязаний, что значительно больше, чем занявшая второе место стратегия ИНТЕРПОКОЛЕНИЕ, победившая в 24 % состязаний.
293
На недавно приобретенную информацию, собственно, опирались многие из лидировавших стратегий.
294
Здесь стратегия ДИСКОНТ-АВТОМАТ единственная среди финалистов использовала модуль экспоненциального уценивания.
295
Hoppitt and Laland 2013.
296
Asch 1955, Latane 1981, Boyd and Richerson 1985, Henrich and Boyd 1998, Morgan et al. 2012, Morgan and Laland 2012.
297
Rogers 1988.
298
Rogers 1988, Feldman et al. 1996, Wakano et al. 2004.
299
Rendell et al. 2010.
300
Более того, средняя окупаемость в течение срока жизни в популяции в общем состязании всех стратегий при одинаковых условиях оказывалась ниже, чем у стратегий, занимавших более низкие места при одиночном разыгрывании.
301
Tilman 1982.
302
Kendal et al. 2009.
303
Средняя продолжительность жизни агентов в нашем турнире составляла 50 раундов. Средняя ожидаемая при рождении продолжительность жизни человека в мире сейчас составляет 67 лет – сравните с 26 годами во времена бронзового и железного веков (Encyclopaedia Britannica, 1961). Таким образом, можно в грубом приближении приравнять раунды турнира к годам человеческой жизни.
304
Rendell, Boyd, et al. 2011; Laland and Rendell 2013.
305
На мой взгляд, своим успехом турнир отчасти обязан использованию «многорукого бандита». Эти «многорукие бандиты» широко применялись для исследования научения в ряде дисциплин, таких как биология, экономика, искусственный интеллект и информатика, поскольку они моделируют общую проблему, стоящую перед особями или индивидами, которым приходится решать, как распределить свое время, чтобы максимизировать отдачу (Schlag 1998, Koulouriotis and Xanthopoulos 2008, Gross et al. 2008, Bergemann and Valimaki 1996, Niño-Mora 2007 и Auer et al. 2002). Они великолепно моделируют многие непростые проблемы реальной действительности – например, ситуацию, когда существует много вариантов вероятного действия, лишь несколько из которых принесут большую отдачу; когда можно учиться несоциальным путем или наблюдая за другими; когда возникают ошибки копирования; когда меняется среда. Конечно, симулятор – это упрощенная версия реального мира, в котором, в отличие от моделируемого, особи или индивиды могут выбирать демонстраторов с определенными характеристиками и в котором существует прямое взаимодействие между особями или индивидами (Apesteguia et al. 2007, Boyd and Richerson 1985, and Laland 2004). Пока еще неизвестно, насколько устойчивыми окажутся наши результаты, если добавить такие переменные в последующих турнирах; возможно, стратегии, занявшие пьедестал почета в нашем турнире, там покажут себя не столь хорошо. (На момент работы над этой книгой мы с сотрудниками анализируем результаты второго турнира стратегий социального научения, в котором к изначальной схеме сделаны три дополнения, предусматривающие возможность смоделировать несбалансированную, пространственно вариативную среду и кумулятивно-культурное научение.) Тем не менее наш турнир гораздо больше приближен к действительности, чем прошлые теоретико-аналитические разработки, поэтому я придаю особое значение его результатам. Базовая универсальность задачи, поставленной нами с использованием «многорукого бандита», вселяет уверенность, что выводы, сделанные на основе полученных данных, окажутся