Шрифт:
Интервал:
Закладка:
Конфаундеры приводят к ошибкам и в крупных исследованиях. Возьмем, к примеру, американскую когорту по изучению здоровья медсестер, которая использовалась в огромном числе различных исследований, об одном из них мы уже говорили ранее в этой главе в примере с кофе и артритом. Другое исследование изучало взаимосвязи между заместительной гормональной терапией и частотой серьезных ишемических заболеваний сердца.
Ученые проанализировали данные 48 470 женщин в постменопаузе в возрасте 30–63 лет, за которыми велось наблюдение в течение 10 лет [23]. В 90‐х годах результаты исследования показали, что заместительная гормональная терапия не только облегчает симптомы, связанные с менопаузой, но и снижает частоту серьезных ишемических заболеваний сердца почти вдвое. Но, как вы, наверное, уже догадались, эти результаты были далеки от правды – эстрогены не только не снижали риск заболеваний сердца, но, возможно, и увеличивали [24].
Несмотря на огромный размер выборки, в исследовании не удалось распознать влияние вмешивающихся факторов, самым сильным из которых было социоэкономическое положение участниц [25]. Оказалось, женщины, которые могли себе позволить заместительную гормональную терапию, как правило, из более высоких социально-экономических слоев, получали качественное медицинское обслуживание, лучшее питание и были физически активны – влияние всех этих обстоятельств не получилось полностью нивелировать в первом исследовании. Однако ошибались и последующие исследования, как «случай – контроль» с больничными выборками, так и когортные исследования с участниками из общего населения [26]. Решающее доказательство потенциального вреда этого лечения пришло из рандомизированного клинического испытания – РКИ, подобного тому, которое доказало эффективность стрептомицина в исследовании Брэндона Хилла.
Все типы исследований, о которых мы пока говорили в этой книге – серии случаев, исследования «случай – контроль», когортные, – относятся к так называемой категории обсервационных (от англ. observe – «наблюдать»), или наблюдательных, исследований, когда за участниками наблюдают – опрашивают, измеряют, обследуют, но активно не вмешиваются в естественный ход событий и тактику лечения. Принципиально отличаются от обсервационных исследований интервенционные (от англ. intervene – «вмешиваться»), к которым относят эксперименты, клинические испытания (англ. clinical trial), в том числе РКИ, о которых мы и поговорим в следующей главе.
Итоги шестой главы
«Вместе» не значит «связаны». Любая видимая взаимосвязь может оказаться следствием третьего фактора, ошибки отбора или случайности. Это три наиболее частые причины, почему научные исследования могут ошибаться.
1. Показатели никак не связаны между собой, а взаимосвязь – чистой воды совпадение (иллюзорная корреляция), как, например, количество потребляемого маргарина и число разводов в стране. Размер исследования имеет значение. Маленькие выборки выдают случайные и ошибочные результаты, поскольку плохо отражают интересующее нас население. Поэтому, когда читаете о каком-нибудь открытии, задайте себе вопрос: а сколько человек участвовало в исследовании? Слишком маленькие выборки – здесь нет конкретной цифры, так как для каждого исследования размер выборки должен рассчитываться индивидуально, но выборки менее 10–20 человек и даже часто менее 50–100 должны вызвать разумные подозрения и желание узнать подробности, найти другие исследования по теме, но с большей выборкой. Большие выборки точнее отражают действительность и дают лучший результат, чем маленькие, но также подвержены влиянию случайности, проклятию больших чисел (чем больше данных, тем меньшие различия можно заметить) и нередко проблеме множественных сравнений. Чем больше сравнений, тем больше вероятность ошибки. Поэтому не позволяйте выборкам с участием более миллиона человек ослепить вас, а в обычной жизни проблема множественных сравнений поможет вам легко объяснить удивительные совпадения.
2. Показатели никак не связаны между собой, а взаимосвязь – результат ошибки в дизайне и анализе исследования (систематическая ошибка или смещение), как, например, в исследованиях о пользе курения. Результаты исследования настолько применимы к реальной жизни, насколько похожи участники исследования на интересующую нас группу. Чтобы понимать, насколько участники опроса отражают мнение населения всей страны или пациентов с тем или иным заболеванием, поинтересуйтесь, как отбирались участники исследования, была ли выборка случайной, многие ли отказались от участия в исследовании, какие характеристики были у финальной выборки.
3. Некий третий фактор влияет на оба показателя, как, например, повышение числа травм среди пешеходов и аварий на дороге, связанные общей причиной – гололедицей. Поэтому, читая результаты исследований, не забывайте рассматривать альтернативные гипотезы и периодически задавать себе вопрос: чем еще может быть вызвана такая ассоциация? Какие еще факторы могут повлиять на результат?
Также, видя разницу, не забывайте о схожести. Оценивайте результаты в целом: в чем были различия между группами, а в чем схожесть; все ли исследования пришли к одинаковому выводу; чем отличались исследования друг от друга; что было результатом, а что – интерпретацией.
Я уверена, у вас обязательно получится.
«ВСЕ СОВПАДЕНИЯ СЛУЧАЙНЫ»: МОРЕ СЛУЧАЙНОСТЕЙ И СЛУЧАЙНЫХ СОБЫТИЙ
КЛЮЧЕВЫЕ ИДЕИ
Глава 7
«А точно поможет?»: море эффектов, эффективностей и конечных точек
После окончания блистательной военно-политической карьеры и двух президентских сроков Джордж Вашингтон возвратился в свое родовое поместье Маунт-Вернон выращивать табак и пшеницу на близлежащих плантациях. Однажды после очередной поездки верхом по своим фермам 67‐летний Вашингтон проснулся с высокой температурой, одышкой и болью в горле. В течение следующих 12 часов врачи лечили его различными сомнительными методами. Например, распространенным в то время кровопусканием, благодаря которому Вашингтон потерял около 40 % крови. После чего умер.
Его болезнь наверняка была серьезной – круп, дифтерия, пневмония или острый бактериальный эпиглоттит или что-то подобное. Как бы то ни было, кровопускание причинило дополнительные страдания и ускорило смерть. А все потому, что преимущества такого лечения основывались на предположениях, а не на строгих доказательствах.
В эпоху современной медицины данная тактика может показаться примитивной и невежественной. Тем не менее и сотни лет спустя множество распространенных методов лечения не имеют под собой веских доказательств. Взять, к примеру, назначение добавок магния при судорогах в ногах, диеты для кормящих мам, отказ от орехов и яиц для профилактики аллергии у детей и другие.
В 2013 году Британский медицинский журнал проанализировал три тысячи (!) методов