Шрифт:
Интервал:
Закладка:
Медиана — один из видов среднего значения (центральная тенденция серии наблюдений). Это значение, для которого половина наблюдений больше, а половина меньше. Когда существует равное количество наблюдений, статистики в качестве медианы могут взять среднее арифметическое двух срединных наблюдений. Например, для ряда (10, 12, 16, 17, 20, 28, 32) медиана будет 17. Для (10, 12, 16, 20, 28, 32) — 18 (среднее арифметическое двух срединных величин, 16 и 20).
Мода — один из видов среднего значения (центральная тенденция целой серии наблюдений). Это та величина, которая в распределении появляется чаще всего. Например, для ряда (100, 112, 112, 112, 119, 131, 142, 156, 199) мода будет 112.
Ошибка исключения — ошибка в рассуждении, которая случается, когда делают выводы о целой группе, основываясь на сведениях о нескольких частных случаях.
Обратное утверждение — вид необоснованного дедуктивного рассуждения, имеющего следующую форму:
Если A, то B
B
Следовательно, A
Объединение выборок — объединение наблюдений за одной или более группами. Если группы схожи в каком-то важном аспекте, то есть гомогенны, то это правильный подход. Если нет, это может привести к искажению данных.
Ошибка подтверждения следствием. См. Обратное утверждение.
Противоположное утверждение — вид необоснованного дедуктивного рассуждения, имеющего следующую форму:
Если А, то B
Не A
Следовательно, не B
Разделение на группы — разделение серии наблюдений на более мелкие группы. Это допустимо, когда мы имеем дело с разнородными данными и когда большая группа состоит из объектов, отличающихся только по одному важному показателю. Однако разделение на группы может применяться в жульнических целях, чтобы создать много маленьких групп, которые не сильно отличаются по изучаемой переменной.
Распространенность — число существующих случаев (например, заболевания).
Силлогизм — тип логического утверждения, в котором выводы должны обязательно следовать из посылки.
Среднее — суммарный показатель, характеризующий серию наблюдений. «Среднее» — нетехнический термин, часто под ним понимают среднее арифметическое, медиану или моду.
Среднее арифметическое — один из показателей среднего (центральная тенденция целой серии наблюдений). Его можно высчитать, суммировав все наблюдения и поделив на их количество. Два других типа среднего — это медиана и мода. Например, для (1, 1, 2, 4, 5, 5) среднее арифметическое равно (1 + 1 + 2 + 4 + 5 + 5) / 6 = 3. Обратите внимание, что, в отличие от моды, среднее арифметическое не обязательно находится среди наблюденных значений.
Точные цифры показывают, с точностью до какого десятичного разряда проводили измерение. Например, в числе 909 нет знаков после запятой, это результат измерения с точностью до целых. В числе 909,35 — два знака после запятой, это результат измерения с точностью до сотых. Точные цифры не всегда верные: второе число точнее первого, но не вернее его, если настоящее значение 909,00.
Усеченные оси используются в графиках, в которых шкалы на осях начинаются не с самых низких возможных значений. Иногда это может быть полезно: подробнее изображается та часть графика, где фиксируются результаты наблюдений. Но если использовать эту технику с целью манипуляции, то можно сильно исказить реальность. График, приведенный в качестве примера в этом разделе (см. Диаграмма рассеяния), эффективно использует две усеченные оси и не искажает данных. График, приведенный в части 1, данные искажает, истинные значения представлены на переделанном графике ниже.
Условная вероятность — вероятность, что какое-то событие произойдет при условии, что произойдет или уже произошло другое событие. Например, вероятность того, что сегодня пойдет дождь, при условии, что дождь шел вчера. Слова «при условии» обозначаются вертикальной чертой: |.
Фрейминг — способ, которым сообщают о статистических данных. Например, предоставленный контекст, группа сравнения или объединение выборок могут повлиять на то, как человек интерпретирует информацию. Сравнение общего числа авиакатастроф за 2016 год с показателями за 1936-й может быть неверным, потому что по сравнению с 1936-м в 2016-м было намного больше перелетов, — поэтому такие показатели, как количество авиакатастроф на 100 тысяч перелетов или количество авиакатастроф на 100 тысяч преодоленных километров, предоставляют более точную информацию. Нужно всегда найти лучший фрейм для статистического показателя — это значит наиболее подходящий и информативный. В этом смысле показатели в виде относительных частот обычно оказываются лучше, чем в виде общего количества.
Экологическая ошибка — ошибка в рассуждениях, которая случается, когда делают выводы о человеке, основываясь на совокупных данных (например, на среднем внутри класса).
Экстраполяция — процесс угадывания или выведения заключения о том, какие значения могут принимать величины за пределами интервала наблюденных значений.
Вдохновение для написания я почерпнул у Даррелла Хаффа в книге How to Lie with Statistics, которую прочитал несколько раз, с каждым разом все больше и больше понимая ее ценность. Я был большим фанатом книги Джоэла Беста Lies and Statistics, а также Чарльза Уилана и его Naked Statistics. Я обязан всем троим юмором, мудростью и озарением. И, надеюсь, у всех тех, кто хочет научиться мыслить критически, моя книга займет достойное место на полке рядом с трудами этих авторов.
Мой агент, Сара Челфант из агентства Wylie Agency, просто мечта: дружелюбная, внимательная, неутомимая, всегда готовая оказать поддержку. Я чувствую свою избранность, потому что имел честь работать с ней и ее коллегами из TWA: Ребеккой Нэйджел, Стефани Дербишир, Альбой Циглер-Бэйли и Селией Кокорис.
Я очень благодарен всем, кто трудится в издательстве Dutton/Penguin Random House. Стивен Морроу работал в качестве редактора над четырьмя моими книгами и сделал каждую из них намного лучше. Он был очень хорошим наставником, я очень ценю его поддержку. Благодарю Адама О’Брайена, ЛиЭнн Пембертон, а также Сьюзен Шварц. Снимаю шляпу перед Беном Севиром, Амандой Уокер и Кристин Болл — они проделывают огромную работу, чтобы книги нашли своих читателей. Бекки Мейнз — больше, чем просто редактор, готовящий рукопись к печати. Мне очень понравились широта ее взглядов и глубина ее знаний, а также пояснения, которая она делала.
Выражаю признательность всем, кто участвовал в обсуждении, делился комментариями к моим черновикам, — вы все мне очень помогли: Джоуи Остервейл, Хизер Бортфельд, Лью Голдберг и Джеффри Моджил. За помощь со специфическими пассажами в книге я в неоплатном долгу перед Дэвидом Эйдельманом, Чарльзом Фуллером, Чарльзом Гейлом, Скоттом Графтоном, Прабхат Джа, Джеффри Кимболлом, Хоуи Клейном, Джозефом Лоренсом, Гретхен Либ, Майком Макгуайром, Региной Нуццо, Джимом О’Доннеллом, Джеймсом Рэнди, Джаспером Райном, Джоном Тирни и теми моими многочисленными коллегам из Американской статистической ассоциации, которые помогали с редактурой и вычиткой гранок. Особенно благодарю Тимоти Армистеда, Эдварда К. Ченга, Грегга Гаскона, Эдварда Грейсли, Кристал С. Лангле, Стэна Лазика, Доминика Лусинчи, Венди Мирвалдис, Дэвида П. Николса, Морриса Олицки и Карлу Зейлемакер. Мои студенты в Университете Макгилл, которые занимаются на моих семинарах по проведению независимых исследований, помогли мне с примерами и сделали мое мышление более ясным. Карл-Филип Зеймор на протяжении работы над четырьмя книгами помогал мне с цифрами, подбадривал, а также решал технические проблемы самого разного рода. Линдсей Флеминг, ассистент офиса, помогала мне планировать мое время и не терять концентрацию, а также выполняла множество самых разных поручений: проверяла примечания в конце книги, список терминов и факты, вычитывала гранки и делала много из того, что требовалось для написания книги. (Спасибо также Элиоту, Грейс, Луа и Кеннис Флеминг за то, что потратили на меня свое время.)