Шрифт:
Интервал:
Закладка:
«Ой»! — от лица статистиков всего мира.
Я признаю, что в статистическом подходе в целом есть нечто упрощающее: желание укротить дикий, непредсказуемый мир и превратить его в послушные ряды чисел. Вот почему так важно относиться ко всей статистике со скептицизмом и осторожностью. По своей природе она сжимает реальность. Усекает. Упускает. Упрощает.
Естественно, именно в этом источник ее силы.
Почему научные статьи снабжают аннотацией? Зачем нужны заголовки новостных заметок? Зачем нужны трейлеры боевиков, где показаны все самые впечатляющие взрывы и саркастические реплики после них? Потому что упрощение — жизненно важное дело. Ни у кого нет времени день-деньской восхищаться калейдоскопическим блеском реальности. У нас и так есть чем заняться: бегать по делам, просматривать статьи и тупо пялиться на ролики в YouTube. Если я еду в другой город в июле, мне не нужны лирические описания влажного и жаркого воздуха; мне просто нужно знать температуру. Такую статистику нельзя назвать живой, глубокой и конфигуральной (что бы сие ни значило). Она проста, ясна и полезна. Сжимая мир, статистика дает нам шанс понять его.
И это далеко не все. Статистика классифицирует, экстраполирует и прогнозирует, позволяя нам выстраивать эффективные модели реальности. Да, весь этот процесс основан на упрощениях. И да, упрощение — это обман через умалчивание. Но в лучших проявлениях статистика — честная разновидность лжи. Этот процесс взывает к самым благородным атрибутам человеческой мысли, от любознательности до милосердия.
В этом плане статистика не так уж отличается от схематичных человечков. Это дурацкие рисунки, где нет ладоней и носов, и все же по-своему они правдивы.
И зачем ею все-таки пользоваться?
Окей, давайте взглянем непредвзято. Статистика — это ложь. Ей нельзя доверять. Так говорили все умнейшие люди в истории. Или нет?
К чему я клоню? Да, цифры могут лгать. Но и слова тоже — не говоря уже о картинах, жестах, хип-хоп-мюзиклах и электронных рассылках с просьбами о фандрайзинге. Наша система морали обвиняет обманщика, а не средство обмана. На мой взгляд, самые интересные критические высказывания в адрес статистики касаются не подлости статистиков, а самой математики. Мы можем повысить ценность статистики, понимая ее несовершенства, осознавая, какую цель преследует тот или иной статистический анализ — и что он намеренно оставляет за скобками. Может быть, тогда мы сможем стать ответственными гражданами, о которых мечтал Герберт Уэллс[143].
Как вычислить? Сложите все величины, которые у вас есть. Затем разделите эту сумму на количество величин.
Когда использовать? Среднее арифметическое (или среднее значение, как часто говорят) удовлетворяет основной потребности статистики: уловить центральную тенденцию совокупности величин. Каков средний рост игрока баскетбольной команды? Сколько рожков мороженого вы продаете в день? Насколько весь класс справился с контрольной работой? Если вы хотите охарактеризовать совокупность величин одним числом, то разумно в первую очередь начать со среднего арифметического.
Почему нельзя доверять? Среднее арифметическое учитывает лишь два показателя: общую сумму и количество людей, внесших свою лепту.
Если вы когда-нибудь делили пиратский клад, то осознаете опасность: есть много способов делить добычу. Сколько получает каждый? Что мы видим: баланс или перевес в чью-то пользу? Если я умял всю пиццу и ничего вам не оставил, насколько честно говорить, что в среднем мы съели по полпиццы? Вы можете сказать гостям за ужином, что у среднестатистического человека один яичник и одно яичко, но следом, возможно, повиснет неловкая пауза. (Я пробовал; так и произошло.)
Людей волнуют вопросы распределения ресурсов. Вычисляя среднее арифметическое, мы закрываем на них глаза.
Спасительная благодать заключается в том, что эта особенность упрощает вычисления. Скажем, вы сдали экзамены на 87, 88 и 96 баллов. (Да, вы царь горы в этом классе.) Чему равен ваш средний балл? Не перегревайте нейроны сложением и делением; просто перегруппируйте величины. Отнимите шесть баллов от последней оценки; прибавьте три балла к первой и два — ко второй. Теперь ваши оценки равны 90, 90, 90 плюс один дополнительный балл. Поделите этот балл на три, и, не перенапрягая извилины, вычислите свою среднюю оценку: 90⅓.
Как вычислить? Упорядочите ваши величины по возрастанию и возьмите средний элемент. Ровно половина величин будет меньше, ровно половина — больше.
Когда использовать? Медиана, как и среднее арифметическое, характеризует центральную тенденцию совокупности величин. Разница в ее чувствительности к отклонениям — или скорее нечувствительности.