Шрифт:
Интервал:
Закладка:
Если новое лечение дает тот же эффект, что и плацебо, разница равна нулю. Если новое лечение лучше, чем плацебо, разница выходит со знаком плюс, если хуже – со знаком минус. Разница в 0,2 считается маленькой, в 0,5 – средней, а больше 0,8 – большой.
• Если измерения являются бинарными (да/нет) или порядковыми категориями (количество смертей/выздоровлений/госпитализаций и т. д.), размер эффекта вычисляется тремя относительными показателями, о которых мы уже говорили в 5‐й главе:
º отношение шансов (ОШ, с англ. odds ratio) – отношение шансов развития определенного клинического исхода в основной группе к шансам его развития в контрольной группе;
º относительный риск (ОR, с англ. relative risk) – отношение вероятностей развития определенного исхода в группах сравнения. Например, соотношение пациентов, получивших ответ на лечение, разделенное на соотношение пациентов, ответивших на другое лечение (или плацебо);
º отношение рисков (с англ. hazard ratio) – показатель, который в широком смысле эквивалентен относительному риску (ОР; см. выше), но применяется в случаях, когда величина риска меняется со временем. Этот показатель включает информацию, собранную неоднократно за период наблюдения, и используется при оценке изменений выживаемости.
Чем ближе значение этих трех показателей к 1, тем меньше различий в эффективности вмешательств, применявшихся в основной и контрольной группах.
Важно обращать внимание, если разница представлена в абсолютных цифрах или в относительных цифрах (например, «улучшение при лечении X в пять раз выше улучшения при лечении Y»). В жизни мы часто сталкиваемся с относительными и абсолютными показателями в период распродаж, когда одни продавцы пишут: «Купите со скидкой 1000 рублей» (абсолютная разница в цене), а другие: «Купите со скидкой 30 %» (относительная разница в цене). Или, возвращаясь к нашему примеру в магазине бытовой техники, разница между моделями по интересующим вас параметрам может быть как в относительных показателях – этот работает на 30 % дольше, чем другой, так и в абсолютных – этот прослужит вам на 2 года больше.
Как и в магазине, для оценки эффективности нам нужны и относительные, и абсолютные показатели. Предположим, мы знаем, что терапия удваивает вероятность успешного исхода. Абсолютный эффект лечения зависит от исходной вероятности успешного исхода. Если он низкий, скажем 1 %, терапия увеличивает успешные результаты только на один процентный пункт до 2 %, что является довольно небольшим увеличением в абсолютном выражении. Напротив, если исходный уровень успеха составляет 30 %, показатель успеха лечения составляет 60 %, это гораздо большее увеличение в абсолютном выражении.
Во время массовой вакцинации от коронавируса мы то и дело видели в новостях обнадеживающие результаты исследований эффективности вакцин: американской фармкомпании Pfizer и немецкого BioNTech была 95 %. Эффективность другой американской вакцины фирмы Moderna, по предварительным данным, составляла 94 %. Эффективность российской вакцины «Спутник» по предварительным данным, составляла 91 %. Но что на самом деле значит эффективность 90 %?
Некоторые ошибочно полагали следующее: вакцина защищает от вируса 90 человек из 100. На самом деле это значит, что вакцина снижает риск заражения на 90 %. Это относительный показатель, более точно называемый «относительное снижение риска» (англ. relative risk reduction), который рассчитывается как арифметическая разница между риском среди невакцинированных и риском среди вакцинированных, поделенная на риск среди невакцинированных. Он говорит нам, например, «насколько хорошо вакцина защищает участников исследования от заболевания».
Давайте посмотрим на абсолютные цифры на примере вакцины компании «Модерна» (предварительное название mRNA‐1273). Всего в исследовании приняло участие 30 420 человек, которые были рандомно распределены в две группы по 15 210 в каждой. За время наблюдения симптомы SARS-CoV‐2 появились у 185 участников плацебо группы и у 11 участников, получивших вакцину: 185 – 11 / 185 = получим 94 % эффективность. Важно, что тяжелая инфекция наблюдалась только у 30 человек, 1 из которых умер, и все были в плацебо-группе.
Когда мы говорим о вакцинах, есть еще один показатель, взволновавший население, – это абсолютное снижение риска (англ. absolute risk reduction). Данный показатель рассчитывается как арифметическая разница между процентом заболевших между группами. То есть если в относительной разнице мы принимаем во внимание только число заболевших, здесь мы берем в расчет всех, получивших или не получивших вакцину. В случае с «Модерной», число заболевших в плацебо-группе составило 185 из 15 210, то есть 1,22 %, а среди вакцинированных 11/15 210–0,07 %. Арифметическая разница между этими показателями и будет абсолютным снижением риска – то есть чуть более 1 %. Такой результат насторожил многих пользователей интернета, и добавил аргументов в пользу того, что строгие меры по контролю коронавируса и массовая вакцинация не обоснованы. Однако, если посмотреть на абсолютное число инфицированных в группах (185 против 11), разница очевидна. 1 % кажется маленьким числом, а 164 предотвращенных инфекций, среди которых могли оказаться пожилые или ослабленные болезнями люди, – это много.
2.3 Доверительный интервал
Еще одним важным показателем для любой статистики является доверительный интервал – показатель точности количественного показателя.
Практически все измерения имеют некоторую погрешность. Если измерить один и тот же показатель 10 раз, результаты могут отличаться из-за естественной изменчивости и экспериментальной неточности. Некоторые измерения имеют меньшую погрешность, как, например, измерение роста человека. Если измерить 10 раз в один и тот же час рост одного и того же человека, вероятная разница будет в пределах сантиметра. Если измерять рост в течение дня, разница будет в пределах нескольких сантиметров просто потому, что рост в течение дня действительно меняется. Другие измерения, например УЗИ, зависят не только от особенностей организма, но и от особенностей аппарата и квалификации врача и часто дают большие различия между сканированиями. В некоторых случаях ошибка измерения может быть большой в сравнении с реальной разницей. Это если измерять одного и того же человека. А если нескольких людей? Погрешности неизбежны.
Поэтому для каждого количественного результата, в том числе эффективности, обычно измеряют его доверительный интервал (ДИ, или англ. confidence interval CI), то есть диапазон возможных значений, в котором с определенной вероятностью находится истинное значение. Альтернативная интерпретация – если провести очень большое количество аналогичных независимых экспериментов, то 95 % полученных значений будут находиться в пределах этого диапазона. Доверительный интервал часто выкидывают из новостей, только упоминая, что новое лечение «на 17 % увеличивает выживаемость», но эти 17 % – усредненное значение. Важно знать диапазон –