Шрифт:
Интервал:
Закладка:
Теперь представьте, что вы бросили монету два раза и затем подсчитываете общее количество выпавших орлов и решек. Возможны три варианта: два орла, две решки, орел и решка. Есть большой соблазн предположить, что вероятность наступления этих трех событий одинакова, но это не так. На самом деле вероятность выпадения орла и решки равна 50 %, а выпадения двух орлов или двух решек – по 25 % каждая.
Этот дисбаланс обусловлен тем фактом, что две различные комбинации дают один и тот же конечный результат. Если дважды подбросить монету, фактически есть четыре возможных варианта: орел-орел, орел-решка, решка-орел и решка-решка. Варианты орел-решка и решка-орел дают один и тот же конечный результат: один орел и одна решка, в связи с чем вероятность выпадения такой комбинации в два раза больше. Игроки также знают, что если подбросить два игральных кубика, то выпавшая сумма будет с большей вероятностью равна 7, чем 12, потому что есть много комбинаций, сумма которых равна 7 (1 + 6, 2 + 5, 3 + 4, 4 + 3, 5 + 2 и 6 + 1) и только одна, дающая 12 (6 + 6).
Чем больше раз подбросишь монету, тем более выраженным становится это явление. Сценарии отклоняются от среднего значения, постепенно становятся исключительно редкими по сравнению со средними значениями.
Если вы подбросите монету десять раз, есть примерно 66 %-ная вероятность того, что выпадет от 4 до 6 орлов.
Если подбросить ее сто раз, то с вероятностью 96 % выпадет от 40 до 60 орлов. А если подбросить ее тысячу раз, то вероятность выпадения от 400 до 600 орлов достигнет 99,99999998 %.
Если построить гистограммы, соответствующие 10, 100 и 1000 подбрасываниям монеты, то можно заметить, что ближе к центру концентрируются более длинные столбцы, соответствующие наибольшей вероятности, а крайние варианты становятся невидимыми невооруженным глазом.
Гистограмма возможных комбинаций при 10 подбрасываниях
Гистограмма возможных комбинаций при 100 подбрасываниях
Гистограмма возможных комбинаций при 1000 подбрасываниях
Таким образом, закон больших чисел доказывает: при бесконечном повторении экспериментов со случайным исходом среднее арифметическое значение выборки и значение с наибольшей вероятностью выпадения совпадут.
Этот принцип лежит в основе всех опросов и других статистических приемов. Опросим 1000 человек, какой шоколад они предпочитают: темный или молочный. Если 600 ответят – черный, а 400 – молочный, высока вероятность того, что доля предпочтений населения, даже если оно состоит из миллионов человек, также будет близка к 60 %, предпочитающих темный шоколад, и 40 % – молочный. Если задать вопрос о вкусе случайно выбранного человека, то его ответ будет аналогом выпадения орла или решки. Отличие лишь в том, что орел и решка заменяются темным и молочным шоколадом.
Конечно, может оказаться, что все 1000 опрошенных будут любить темный шоколад или, наоборот, опросят всех тех, кто любит только молочный шоколад. Но вероятность наступления крайних случаев ничтожно мала, и закон больших чисел гарантирует, что при опросе достаточно большой выборки людей полученное среднее значение будет близко к среднему значению для всего населения.
При дальнейшем анализе различных сценариев и вероятности их наступления можно также установить доверительный интервал и оценить вероятность ошибки. Можно, например, сказать, что существует 95 %-ная вероятность того, что доля людей, предпочитающих темный шоколад, составляет от 57 до 63 %. Все объективные исследования должны сопровождаться данными об их точности.
Треугольник Паскаля
В 1654 г. Блез Паскаль опубликовал книгу под названием «Трактат об арифметическом треугольнике». Он описывал треугольник, состоящий из ячеек, внутри каждой из которых содержатся числа.
Здесь представлены только первые семь строк, но треугольник может быть продолжен до бесконечности. Цифры в ячейках определяются двумя правилами. Во-первых, в крайних ячейках содержатся числа 1. Во-вторых, числа, записанные во внутренних ячейках, равны сумме чисел двух ячеек, расположенных непосредственно над ними. Например, число 6, записанное в ячейке на пятой строке, получено в результате сложения двух 3, которые расположены над ним.
На самом деле этот треугольник был известен еще задолго до того момента, когда им заинтересовался Паскаль. Персидские математики аль-Караджи и Омар Хайям открыли его еще в XI в. В то же время его свойства изучал в Китае Цзя Сян, чью работу продолжит в XIII в. Ян Хуэй. В Европе Тарталья и Виет также знали о его существовании. Тем не менее Блез Паскаль был первым, кто посвятил этому явлению такой полный и подробный трактат. Он также был первым, кто заметил тесную связь между этим треугольником и подсчетом вероятности.
Каждая строка треугольника Паскаля позволяет подсчитать количество возможных вариантов последовательности событий с двумя вариантами, как, например, орел и решка. Если подбросить монетку три раза, то получится восемь вариантов комбинаций: орел-орел-орел, орел-орел-решка, орел-решка-орел, орел-решка-решка, решка-орел-орел, решка-орел-решка, решка-решка-орел и решка-решка-решка. Проводя анализ возможных комбинаций, можно прийти к следующим выводам:
• 1 комбинация с тремя орлами;
• 3 комбинации с двумя орлами и одной решкой;
• 3 комбинации с одним орлом и двум решкам;
• 1 комбинация с тремя решками.
Данная последовательность чисел, 1–3–3–1, точно соответствует четвертой линии треугольника. Это не случайность, что и было доказано Паскалем.
Если, например, посмотреть на шестую строчку, можно увидеть, что если подбросить монету пять раз, то в 10 случаях выпадут 2 орла и 3 решки. Двигаясь вниз по треугольнику, можно оценить варианты комбинаций при десяти подбрасываниях монеты: они находятся на 11-й строчке. Вероятности для ста бросков будут находиться на 101-й строчке и так далее. С помощью треугольника Паскаля можно легко проверить представленные выше гистограммы. Без этого последующие числа были бы настолько велики, что совсем скоро их было бы невозможно перечислить по отдельности.