Шрифт:
Интервал:
Закладка:
Эта логика имеет смысл в таких играх, как футбол, бейсбол или теннис, в которых одна и та же ситуация складывается много раз в течение одного матча, а в борьбу во многих матчах вступают одни и те же игроки. Кроме того, в этих играх есть время и возможность обнаружить любые системные действия соперников и отреагировать на них. С другой стороны, важно избегать в игре таких схем, которые соперники могут использовать с выгодой для себя, и придерживаться оптимальной смешанной стратегии. Но как быть с играми, которые происходят только один раз?
Рассмотрим в качестве примера выбор позиций для наступления и обороны во время сражения. Эта ситуация поистине уникальна: противник не может вывести какую бы то ни было закономерность на основании ваших прошлых действий. Однако необходимость в случайном выборе возникает в связи с возможностью шпионажа. Если вы выберете определенный курс действий, а противник узнает, что вы собираетесь делать, он изменит свой план так, чтобы поставить вас в самое невыгодное положение. Вам необходимо застать противника врасплох, а самый верный способ сделать это сводится к тому, чтобы действовать неожиданно даже для самих себя. Вы должны как можно дольше воздерживаться от выбора и сделать его в самый последний момент, применив для этого непредсказуемый, а значит, защищенный от шпионажа, способ. При этом соотношение разных вариантов выбора в вашей стратегии должно быть таким, чтобы противник, узнав об этом, не смог воспользоваться данной информацией в своих целях. Это и есть оптимальное смешивание стратегий, о котором шла речь.
И наконец, хотелось бы сделать одно предостережение. Даже если вы используете оптимальный вариант смешивания стратегий, все равно в некоторых случаях вы будете получать плохой результат. Даже если игрок, выполняющий пенальти, действует непредсказуемо, вратарь может угадать направление удара и отразить его. В американском футболе, когда после третьей попытки осталось пройти один ярд, разумно прорываться с мячом посередине, но важно также время от времени делать длинный пас, чтобы не дать защищающейся команде разгадать схему нападения. Если такой пас оказывается успешным, болельщики и спортивные комментаторы восхищаются столь изобретательным выбором схемы игры и называют тренера гением. В случае неудачного паса тренера подвергают жесткой критике: как он мог делать ставку на длинный пас, вместо того чтобы выбрать более безопасную схему игры?
Разъяснять стратегию тренера необходимо еще до ее применения в том или ином матче. Тренер должен донести до всеобщего сведения тот факт, что прорыв с мячом посередине поля остается элементом осторожной и методичной схемы игры именно благодаря отвлечению части игроков защищающейся команды на оборону от случайного длинного паса, который может обойтись команде слишком дорого. Однако мы допускаем, что даже если накануне игры тренер во всеуслышание заявит об этом во всех газетах и на всех телеканалах, а затем использует длинный пас, который окажется неудачным, на него все равно обрушится лавина критики, как если бы он и не пытался объяснить широкой публике элементы теории игр.
До сих пор мы рассматривали в этой главе только антагонистические игры, в которых интересы игроков полностью противоположны: игры с нулевой суммой или игры с постоянной суммой. Однако мы неизменно подчеркиваем, что в реальной жизни интересы людей могут совпадать, а могут и противоречить друг другу. Играет ли смешивание стратегий значимую роль в играх с ненулевой суммой? Да, но с некоторыми условиями.
В качестве иллюстрации еще раз рассмотрим охотничью версию игры «семейный спор», о которой шла речь вглаве 4. Вспомните наших отважных охотников Фреда и Барни, которые решают (каждый в своей пещере), на какого зверя им охотиться – на оленя или на бизона. Удачная охота требует совместных усилий обоих охотников, поэтому, если они выберут противоположные варианты, никто из них не добудет мяса. И Фред, и Барни заинтересованы в том, чтобы предотвратить такой итог. Однако помимо двух вариантов благополучного исхода (при условии, что они охотятся на одном участке) нужно учесть, что Фред отдает предпочтение мясу оленя и оценивает результат совместной охоты на этого зверя как четыре вместо трех единиц мяса, тогда как у Барни противоположные предпочтения. Следовательно, таблица их выигрышей выглядит так:
Как мы уже убедились, в этой игре есть два равновесия Нэша; в таблице они выделены серым цветом. Теперь мы назвали бы их равновесиями в чистых стратегиях. Но возможно ли такое равновесие в игре со смешанной стратегией?
По каким причинам Фред выбрал бы смешанную стратегию? Возможно, он не уверен в том, что именно выберет Барни. Если под влиянием этих субъективных сомнений Фред оценивает число случаев, когда Барни выберет охоту на оленя и на бизона, как y и (1 – у) соответственно, тогда он рассчитывает на выигрыш в размере 4y + 0(1 – y) = 4y, если он сам выберет охоту на оленя, и 0y + 3(1 – y), если он сам выберет охоту на бизона. Если y имеет значение, при котором 4y = 3(1 – y), или 3 = 7y, или y = 3∕7, тогда Фред получит один и тот же выигрыш, выбрав стратегию охоты на оленя или на бизона, а также если он решит использовать обе стратегии в любой пропорции. Предположим, что Фред смешивает стратегию охоты на оленя и на бизона в таких пропорциях, что для Барни не имеет значения, какую из чистых стратегий выбрать. (Эта игра симметрична, поэтому вы можете предположить – и подтвердить это предположение расчетами, – что Фред должен смешивать свои стратегии, выбирая охоту на оленя в x = 4∕7 случая.) При этом Барни тоже мог бы смешивать свои стратегии по такому принципу, чтобы Фреду было все равно, какую стратегию выбрать, а значит, Барни сам мог бы выбрать оптимальную стратегию. Эти два варианта смешивания стратегий – x = 4∕7 и y = 3∕7 – образуют равновесие Нэша в смешанных стратегиях.
Всегда ли такое равновесие обеспечивает удовлетворительный результат? Нет. Проблема в том, что два охотника делают свой выбор независимо друг от друга. Следовательно, Фред выберет охоту на оленя, тогда как Барни выберет охоту на бизона, в 4∕7 × 4∕7 = 16∕49 случаях, и наоборот – в 3∕7 × 3∕7 = 9∕49 случаях. Таким образом, в 25∕49 или немногим более половины случаев два охотника окажутся на разных участках и получат нулевой выигрыш. Воспользовавшись приведенными формулами, мы увидим, что каждый из них получит выигрыш в размере 4 × 3∕7 + 0 × 4∕7 = 12∕7 ≈ 1,71, что меньше выигрыша 3 в случае неблагоприятного равновесия в чистых стратегиях.
Для того чтобы избежать таких ошибок, Фреду и Барни необходимо согласовать свои действия в плане смешивания стратегий. Могут ли они сделать это, находясь в отдаленных пещерах и не имея никаких средств связи? Возможно, охотники могли бы заранее договориться о согласовании действий, опираясь на то, в каких условиях оба будут собираться на охоту. Предположим, в их местности половину дней в году по утрам идет дождь. Фред и Барни могут договориться, что оба отправятся охотиться на оленя, если в тот день пойдет дождь, и на бизона – если будет сухо. В таком случае каждый из них получит средний выигрыш в размере ½ × 3 + ½ × 4 = 3,5. Таким образом, скоординированная рандомизация обеспечивает охотникам изящный способ найти нечто среднее между благоприятным и неблагоприятным равновесием Нэша в чистых стратегиях, иными словами, воспользоваться таким инструментом, как переговоры.