Шрифт:
Интервал:
Закладка:
Исходя из этого «отсутствия разницы» между более длительными и более короткими схемами диализа, рекомендации по лечению пациентов изменили в сторону сокращения длительности диализа. В целом принятое решение можно сформулировать следующим образом. Данные показывают, что более длительное лечение диализом увеличивает пользу для пациентов; однако вероятность того, что это ошибочный вывод, составляет 6 %, и поскольку мы уверены в наличии пользы только на 94 %, этого недостаточно, чтобы оправдать более длительное лечение. После внесения этого изменения в лечебный регламент смертность пациентов повысилась. Оглядываясь назад, было признано, что это решение оказалось неверным и, вероятно, стоило здоровья и жизни большому количеству людей. Что стоило этим людям жизни, так это слепое и бездумное следование критерию P = 0,05, без учета более тонкого контекста и соотношения риск/польза от применения такого стандарта[208].
Для сохранения объективности научных исследований нужно иметь некоторое пороговое значение ошибки, чтобы уверенно сделать вывод, что наблюдаемая связь является «реальной», а не случайной, но имеет значение уровень, на котором мы проводим черту. Конечно, все мы хотели бы иметь самый низкий уровень ошибок в наших наблюдениях, так почему бы не установить значение Р = 0,01 или даже 0,0001? К сожалению, проведение экспериментов требует ресурсов, а иногда и огромных ресурсов. Как видно из табл. 9.1, при определенном значении масштаба (и, следовательно, стоимости) исследование достигает точки уменьшения отдачи от увеличения статистической мощности. Проведение клинических испытаний лекарств может стоить миллионы долларов, не говоря уже о том, что они оказывают очень заметное (и не всегда благотворное) влияние на жизнь участников. Таким образом, необходимость установить приемлемый для всех уровень допустимой ошибки является обоснованной, хотя и достойной сожаления реальностью. При этом есть некоторые ситуации, когда корректировка приемлемых статистических уровней погрешности действительно необходима.
Например, если кто-то разрабатывает скрининговый тест на инфекцию ВИЧ, то статистический порог положительного срабатывания следует установить максимально низким; другими словами, тест должен выявлять 100 % случаев заболевания. За это неизбежно придется заплатить некоторым количеством ложных срабатываний. Однако цена пропуска реальных случаев ВИЧ — скорая смерть для инфицированных пациентов и опасность заражения для окружающих. Стоимость ложных срабатываний тоже не равна нулю, так как они могут вызвать ужасные моральные страдания у тех, кто получит ложноположительные результаты теста, вплоть до потребности в психологической помощи; за положительным результатом должен следовать специальный подтверждающий тест, назначение которого — минимизировать ложноположительные результаты. Почему бы в первую очередь не использовать подтверждающий тест для скрининга? Потому что это дало бы много ложных отрицательных результатов и пропустило бы некоторые случаи (см. раздел об игнорировании статистической базы в главе 7).
Практика контролируемых испытаний, повторений и больших размеров выборки частично снижает неопределенность, но никогда не устраняет ее. Статистика может дать количественную оценку остающейся неопределенности. Наука не только понимает и признает, что она будет делать ошибки, но и благодаря статистической теории, о которой шла речь ранее, она может оценить, как часто она будет делать ошибки, и долю ошибок, которые допустимо иметь в отношении конкретных наблюдений. Таким образом, дело не в том, что наука «делает все правильно» на практике; наоборот, наука лучше всех понимает, как часто она будет ошибаться, что дает ей более разумную уверенность и/или скептицизм по поводу своих выводов[209]. Это еще одна причина, по которой вы никогда не найдете для себя в науке той уверенности, которую предлагают другие системы убеждений, поскольку одна из задач науки заключается в том, чтобы уделять особое внимание неопределенности — смело смотреть ей в глаза и определять ее количественно. Наука может быть вполне уверена в своей неопределенности, и именно на этом она ограничивает (или, по крайней мере, должна ограничивать) уверенность, которую вкладывает в свои утверждения.
Этот подход не встречается во многих других системах мышления, которые сосредоточены на отдельных свидетельствах, без оценки вероятности того, что такие свидетельства отражают реальную картину мира или являются просто случайным явлением. По причинам, объясненным в предыдущих главах, людям может казаться, что многие вещи просто не могли произойти случайно, что они должны быть наполнены смыслом, но это лишь присущее людям искажение восприятия — статистические методы и анализ помогают нам оценить, в какой степени достоверны наши наблюдения и их интерпретация.
Простые американцы как группа, по-видимому, в значительной степени доверяют науке как источнику новых технологий, знаний, лекарств и т. д. Действительно, американцы не только пользуются продуктами науки, но и направляют огромные суммы налоговых сборов на финансирование научных исследований. Американцы также твердо верят в паранормальные явления. Согласно опросу Гэллапа 2005 года, трое из каждых четырех американцев верят в паранормальные явления, при этом 41 % верят в экстрасенсорное восприятие, 37 % полагают, что в домах могут быть привидения, 32 % верят в призраков, 26 % — в ясновидение, 25 % — в астрологию, 21 % — в мысленное общение с мертвыми и 21 % верят в ведьм[210].
В поиске границы между научной и ненаучной мыслями полезно сосредоточить внимание на той области, где сталкиваются научная практика и другие системы убеждений. Как я говорил ранее, не существует причин, по которым один подход должен быть заведомо правильным, а другой — нет, но есть фундаментальные различия, которые действительно выглядят принципиальными и непреодолимыми. Одно из таких глубоких различий, о котором говорится в этой главе, заключается в том, как разные системы убеждений решают проблему ошибочного принятия случайных событий за важные данные наблюдений. Стоимость этого вопроса довольно высока. Американцы тратят огромные деньги на гадалок, экстрасенсов, толкователей карт Таро и другие, более экзотические способы предсказания будущего. Хотя для некоторых это может служить разновидностью развлечения, большинство людей, пользующихся подобными услугами, скорее всего, действительно надеются получить информацию о будущем, в соответствии с которой они могут действовать. Другими словами, они хотят достичь большей способности предсказывать и контролировать, что также является основной целью и назначением науки. Так что мотивации в чем-то схожи, если не идентичны.