Шрифт:
Интервал:
Закладка:
• Поставщикам данных необходимо обеспечить воспроизводимость результатов. Чтобы продемонстрировать надежность, информация должна быть доступной, доходчивой, поддающейся оценке и полезной.
• Коммуникаторы должны быть осторожны, пытаясь подогнать статистические тексты под стандартные правила повествования.
• Аудитории нужно выявлять недостоверные данные, задавая вопросы о методах подсчета, источниках информации и методах анализа и интерпретации.
• Когда вы сталкиваетесь с каким-то утверждением, основанным на статистических данных, сначала посмотрите, правдоподобно ли оно.
Честно говоря, статистика может быть сложной. Хотя я в этой книге старался познакомить вас с базовыми идеями и не углубляться в технические подробности, в ходе повествования неизбежно пришлось опираться на некоторые сложные концепции. Так что поздравляю тех, кто добрался до конца.
Вместо того чтобы сводить информацию, приведенную в предыдущих главах, к короткому перечню мудрых советов, я воспользуюсь следующими десятью правилами эффективной статистической практики. Они позаимствованы у группы статистиков, которые, как и я в этой книге, старались подчеркнуть нетехнические вопросы, обычно не изучаемые в курсе статистики[276]. Я добавил свои комментарии. Эти правила вполне самоочевидны и довольно точно подытоживают вопросы, рассмотренные в книге.
1. Статистические методы должны позволять данным отвечать на научные вопросы. Спрашивайте: «Почему я это делаю?», а не фокусируйтесь на используемом методе.
2. Сигнал всегда сопровождается шумом. Именно попытки отделить их друг от друга делают эту область интересной. Случайный разброс неизбежен, а вероятностные модели полезны в качестве абстракции.
3. Планируйте, и делайте это как можно раньше. Это включает идею предварительной подготовки для подтверждающих исследований – во избежание степеней свободы исследователя.
4. Обеспечивайте подобающее качество данных. Это фундамент вашей работы.
5. Статистический анализ – это нечто большее, чем просто набор вычислений. Не используйте формулы или программы, если не понимаете, почему вы это делаете.
6. Будьте проще. Основная коммуникация должна быть максимально простой – не демонстрируйте умение строить сложные модели, если они не нужны.
7. Обеспечьте оценки для разброса. С предупреждением, что погрешности, как правило, больше заявленных.
8. Проверяйте свои исходные предположения. Если это невозможно, обязательно разъясните ситуацию.
9. При наличии возможности повторите! Или побуждайте других воспроизводить ваш опыт.
10. Обеспечьте воспроизводимость вашего анализа. Другие должны иметь доступ к вашим данным и коду.
Статистика играет важную роль в нашей жизни и постоянно меняется в ответ на увеличение объема и глубины доступных данных. Но изучение этой науки влияет не только на общество в целом, но и на его отдельных членов. Что касается меня, то написание этой книги позволило мне понять, насколько обогатилась моя жизнь благодаря статистике. Я надеюсь, что и вы ощутите то же самое – если не сейчас, то в будущем.
P-значение: мера расхождения между данными и нулевой гипотезой. Пусть имеется нулевая гипотеза H0 и критерий T, большие значения которого указывают на расхождение с H0. Предположим, что мы наблюдаем некоторое значение t. Тогда (одностороннее) P-значение – это вероятность наблюдения не меньшего экстремального значения при условии истинности H0, то есть P(T≥t|H0). Если о несовместимости с H0 говорят и большие, и малые значения T, то двустороннее P-значение – это вероятность наблюдения таких экстремальных значений в обоих направлениях. Часто двустороннее P-значение берут как удвоенное одностороннее P-значение, в то время как программное обеспечение R использует общую вероятность событий, где вероятность появления ниже, чем реально наблюдаемая;
ROC-кривая: для алгоритма, вырабатывающего какую-то оценку, можно выбрать конкретное пороговое значение, при превышении которого объект классифицируется как «положительный». По мере изменения порогового значения на графике формируется ROC-кривая: получающаяся чувствительность (истинно положительная доля) по оси y, а единица минус специфичность (ложноположительная доля) – по оси x;
t-статистика: статистика, используемая для проверки нулевой гипотезы, что какой-то параметр равен нулю; это отношение оценки к ее стандартной ошибке. Для больших выборок значения больше 2 или меньше –2 соответствуют двустороннему P-значению 0,05; точные P-значения можно получить из статистических программ;
Z-оценка: способ стандартизации наблюдения xi в терминах расстояния от среднего выборочного значения m, выраженного в стандартных отклонениях s, так что zi = (xi − m)/s. Наблюдение с Z-оценкой 3 соответствует трем стандартным отклонениям от среднего, то есть представляет собой довольно серьезным выброс. Z-оценку можно также определять в терминах среднего всей популяции и стандартного отклонения σ, в этом случае zi = (xi − μ)/σ;
абсолютный риск: доля людей в определенной группе, с которыми за указанный период времени произошло интересующее нас событие;
алгоритм: правило или формула, которые получают входные данные/переменные и дают на выходе некоторый результат, например прогноз, классификацию или вероятность;
анализ по назначенному лечению: принцип, согласно которому участники рандомизированных испытаний анализируются в соответствии с вмешательством, которое им назначено, вне зависимости от того, получили ли они его на самом деле;
апостериорное распределение: в байесовском анализе вероятностное распределение неизвестных параметров, определенное с учетом наблюдаемых данных по теореме Байеса;
априорное распределение: в байесовском анализе начальное вероятностное распределение для неизвестных параметров. После наблюдения каких-то данных его пересматривают, получая апостериорное распределение с помощью теоремы Байеса;
асимметричное распределение: распределение (выборки или генеральной популяции), которое несимметрично и имеет длинный левый или правый хвост. Распространено у величин со значительной неравномерностью, например доход или продажи книг. Для таких распределений величины выборочного среднего и стандартного отклонения могут вводить в заблуждение;