Шрифт:
Интервал:
Закладка:
Когда вы покупаете в магазине 1 кг сахара, то предполагаете, что в измерении веса могут быть погрешности – там на самом деле может быть 1010 граммов, или 997 граммов, или даже 975. Если бы это было научное исследование, в результатах ученые бы написали: средний вес этой упаковки сахара составляет 1000 граммов (95 % ДИ 990 до 1010). И здесь важно отметить, что доверительный интервал показывает не диапазон значений отдельных измерений, а диапазон, в котором ожидается обобщающий показатель – среднее значение (или другой обобщающий показатель) при повторении эксперимента.
Доверительный интервал рассчитывается не только для средних значений (как в примере с сахаром), но и для разности показателей в сравниваемых группах. В таком случае доверительный интервал разности дает понимание, насколько в реальности эти группы различаются. Когда доверительный интервал пересекает 0, это означает, что существует вероятность, что исследуемый эффект или разница между группами может быть как положительной, так и отрицательной. Иными словами, результаты исследования не являются однозначными и не позволяют нам сделать окончательный вывод о наличии или отсутствии эффекта. Для получения более точных и надежных результатов требуется дальнейший анализ или сбор дополнительных данных.
Доверительный интервал также рассчитывается для показателей размера эффекта – отношение шансов, отношение рисков и т. д. Ранее в 5-й главе мы говорили, что если ОШ = 1 или ОР = 1, то это означает, что шансы или риск одинаковы для обеих групп, и это справедливо не только для самого показателя, но и для его доверительного интервала. Так и на рисунке внизу мы видим, что лечение А и Б пересекают линию неэффективности, а лечение В и Г – нет. Отсюда делаем вывод: эффект первых двух препаратов статистически незначим.
Рисунок 25. Как интерпретировать эффективность вмешательства с помощью доверительного интервала
Повторим все, что мы изучили в этом параграфе главы на примере РКИ эффективности диеты, богатой омега‐3 кислотами, у пациентов с мигренью, о котором мы говорили ранее. Помните, там было 3 группы, которым прописали либо диету, богатую только омега‐3 (вторая группа), либо диету, богатую и омега‐3, и омега‐6 (третья группа), либо диету, в которой содержание омега кислот соответствовало среднестатистической диете (контроль). В качестве конечных точек ученые выбрали содержание 17‐гидроксидокозагексаеновой кислоты (17-HDHA) в плазме крови (суррогатная конечная точка) и результаты теста из 6 вопросов о том, как головная боль влияет на жизнь пациента, под названием HIT‐6 (твердая, или жесткая, конечная точка). Показатели измерили в начале исследования и спустя 4 месяца.
17-HDHA – предшественник оксилипинов, которые вырабатываются из омега‐3 кислот и показали обезболивающий эффект в лабораторных исследованиях. Обе диеты, богатые омега‐3, действительно смогли повысить исходный уровень 17-HDHA в крови: средняя разница с поправкой на исходный уровень во второй группе равнялась 1,4 нг/мл (95 % ДИ 1,2 до 1,6), в третьей – 1,2 нг/мл (95 % ДИ 1,0 до 1,5), тогда как в контрольной был всего 0,7 нг/мл (95 % ДИ 0,4 до 0,9). Предполагалось, что изменения в лабораторных анализах крови отразятся на влиянии мигрени на жизнь пациента, которое оценивали с помощью теста HIT‐6. Например, один из вопросов теста звучал так: «За последние 4 недели как часто вы чувствовали себя сытым по горло и раздраженным из-за головных болей?» – и общий результат варьировался между 36 и 78 баллами (чем выше балл, тем сильнее влияние мигрени на жизнь пациента). Это как раз то, что важно для врача и пациента. Но, как оказалось, ни одна из диет не смогла уменьшить этот показатель. Разница между второй и контрольной группой с поправкой на исходные значения составила –1,5 балла, а в целом сравнение с исходным уровнем («до и после») показало, что если в начале исследования участники оценили влияние мигрени на их жизнь на 62,7 балла, то после 4 недель диеты группы диеты, богатой только омега‐3, этот показатель снизился до 58,4 балла. «Ну хоть какое-то улучшение» – возможно, подумают некоторые. Однако взглянем на доверительный интервал разности до и после от –4,2 до 1,2 – а это значит, что при повторении эксперимента 100 раз на разных, но таких же выборках пациентов разница средних значений составит для некоторых пациентов –4,2, а для некоторых +1,2 балла. Примерно такой же показатель получили в третьей группе: –1,6 (95 % ДИ от –4,2 до 1,0). Заметьте, мы в первую очередь ориентировались на разницу с контрольной группой, поскольку в ней на среднестатистической диете тоже было улучшение с 62,3 балла до 59,9 (95 % ДИ от 58,0 до 61,8).
Незначительное улучшение все-таки было. Помимо первичных конечных точек (17-HDHA и HIT‐6), ученые оценивали среднее количество часов головной боли в день. И здесь показатели между группами действительно отличались: если в контрольной группе в среднем голова болела в течение 2,1 часа, то во второй группе всего 1,4 часа, а в третьей – 1,3 часа. То есть разница составила –0,7 часа (95 % ДИ от –1,1 до –0,3) и –0,8 (от –1,2 до –0,4). Также улучшение отметили в количестве дней с головной болью за месяц – приступы мигрени стали реже.
Этот пример с исследованием эффективности диеты, богатой омега‐3, в лечении мигрени еще раз напоминает нам о важности твердых точек (так как показатели 17-HDHA улучшились, а результат HIT‐6 теста нет), о важности контрольной группы (ведь им тоже стало лучше), а также о том, что нужно обязательно взглянуть на цифры и их доверительные интервалы, чтобы понять, что кроется за словами «стало лучше» и «помогло» ли вмешательство.
А дальше остановимся еще на одном показателе, который часто встречается в результатах научных исследований как подтверждение эффективности, но не всегда таковым является.
2.4 Не все то золото, что блестит: Значимость в научных исследованиях
Когда вы читаете результаты клинических испытаний, в глаза часто бросается слово «значимый» – значимый результат, значимый положительный ответ, значимое улучшение. Многие из нас приравнивают «значимость» к буквальному значению «важности», то есть «значимые результаты» равно «важные результаты». Однако в клинических исследованиях значимость бывает двух видов: «статистическая значимость» и «клиническая значимость». И то и другое – значимость, но это не одно и то же.
Статистическая значимость отвечает на вопрос: «Возможно ли, что результаты могут быть случайными?» Клиническая значимость отвечает на вопрос: «Будут ли результаты иметь значение для пациентов?»
Статистически значимая разница означает, что статистический тест показал различия между группами, которые не были вызваны исключительно случайностью. Тогда как клинически значимая разница означает