Шрифт:
Интервал:
Закладка:
Давайте посмотрим, как эти две значимости выглядят на примере.
В одном исследовании ученые анализировали выживаемость 569 пациентов с распространенным раком поджелудочной железы [9]. Пациенты были рандомизированы в две группы: первая получала новый препарат эрлотиниб в сочетании со стандартным гемцитабином, вторая – только гемцитабин. Результаты показали: в группе эрлотиниба в сочетании с гемцитабином риск смерти пациентов был «значительно» ниже. Под значимостью здесь подразумевается статистическая значимость, которую определили с помощью «значения р».
Р-значение (пи) отражает, насколько вероятно, что полученный в исследовании результат (и даже предположительно больший результат) может быть следствием случайности. Например, насколько случайна разница между группами лечения. P = 0,01 означает, что с вероятностью 1 из 100 эффект от лечения мог произойти случайным образом, то есть на самом деле лечение неэффективно. Обычно ученые сообщают о значимых результатах, когда р-значение теста меньше 0,05 (1 из 20). Если статистическая значимость больше, чем 0,05, любое значение эффективности лечения будет под большим вопросом, так как невозможно исключить возможность случайных ошибок.
В нашем примере значение р равнялось 0,038, то есть существует лишь 3,8 %-ная вероятность, что наблюдаемая разница между группами возникла случайно. А значит, есть 96,2 %-ная вероятность не наблюдать положительный эффект нового препарата на выживаемость пациентов с распространенным раком поджелудочной железы случайно.
Для нас важно, насколько выражен этот положительный эффект, – так мы можем понять, есть ли реальная польза от нового лечения. Поэтому, помимо значения р, мы обязательно обращаем внимание на количественную разницу между значениями – размер эффекта. В данном примере эффект измерялся в продолжительности жизни на фоне лечения. Анализ выживаемости показал: комбинированная терапия увеличивает выживаемость пациентов на 18 %. Это относительные показатели. А в абсолютных значениях медиана выживаемости (срока дожития) была 6,24 и 5,91 месяца, то есть разница между группами – всего 10 дней. Конечно, ее можно с уверенностью считать клинически несущественным «улучшением», особенно с учетом дополнительной токсичности и затрат, связанных с комбинацией лекарств. Поэтому следует быть осторожными с любыми выводами, основанными только на том, что получен статистически значимый или незначимый результат, и значение p без оценки количественных показателей и важности этих показателей для врача и пациента. Говоря о клинической значимости и размере эффекта, я бы хотела упомянуть еще один термин – «минимальная клинически значимая разница» (с англ. minimal clinically important difference (MCID)). Как следует из названия, этот показатель отражает нижнюю границу разницы в результатах, которая будет клинически значимой для пациента.
Когда мы оцениваем клиническую значимость, важны оба показателя: статистическая значимость и размер эффекта. Например, сравните «показатели боли в суставах до и после лечения значительно отличаются (р < 0,001)» с «на фоне лечения снижение боли в суставах составило от 1 до 2 баллов по 10-балльной шкале с вероятностью случайности наблюдаемого эффекта менее 0,1 %». Оба утверждения следуют из статистического теста, но второе также предполагает, что боль, вероятно, уменьшится на 1–2 балла, учитывая, что в исследования обычно набирают пациентов с уровнем боли >6, такое улучшение, вероятно, будет незначительно в жизни для большинства участников.
Еще один пример: исследование эффективности витамина D и рыбьего жира в профилактике смертности от сердечно-сосудистых заболеваний под аббревиатурой VITAL показало, что смертность при приеме рыбьего жира была на 4 % меньше [41]. Однако эта разница не была статистически значимой (95 %-ный доверительный интервал 0,76–1,21), а значит, полученный эффект вполне мог оказаться случайным.
Клинически значимые результаты всегда должны быть статистически значимыми, но статистически значимые результаты не всегда являются клинически значимыми.
Рисунок 26. Статистическая и клиническая значимость
2.5 Доктор, а мне точно поможет?
Показатели, которые мы разобрали в этой главе, говорили об эффективности как таковой и о том, насколько важны результаты для практики. Но чтобы понять вероятность, поможет то или иное вмешательство конкретному пациенту, есть еще одна статистика, которую вы можете встретить в исследованиях и клинических протоколах, – это число больных, кого необходимо пролечить, чтобы достичь определенного благоприятного исхода или предотвратить один неблагоприятный исход, в сравнении с контрольной группой (англ. number needed to treat, или NNT). Дальше я буду использовать английскую аббревиатуру NNT, так как более вероятно, что вы столкнетесь именно с ней, нежели с русскоязычной аббревиатурой ЧБНЛ.
Идеальный показатель NNT равен 1, когда все больные выздоравливают от лечения, а в контрольной группе никто не выздоравливает. Чем больше NNT, тем больше людей требуется пролечить, чтобы один из них выздоровел, то есть лечение менее эффективно.
Например, исследование ASCOT-LLA оценивало эффект от приема 10 мг аторвастина (понижает уровень холестерина) у пациентов с гипертензией, но без сердечно-сосудистых осложнений (первичная профилактика). За 3,3 года наблюдения риск осложнений снизился на 36 % (относительное снижение риска). Снижение риска в абсолютных значениях было значительно меньше, поскольку исследуемая группа имела невысокую частоту развития осложнений сердечно-сосудистых заболеваний за время исследования: 2,67 % в контрольной группе против 1,65 % в группе пролеченных больных. Прием аторвастатина в течение 3,3 лет в итоге приводил к снижению абсолютных рисков всего на 1,02 % (2,67 % минус 1,65 %). Число больных, которых необходимо лечить, чтобы предотвратить одно осложнение сердечно-сосудистых заболеваний, равнялось 99,7 за 3,3 года.
NNT находится в обратной зависимости от разницы показателей между группами. Например, если она равняется 1, то NNT = 2. Чем разница ближе к 0, тем больше людей надо пролечить, чтобы получить эффект.
Возможно, вас напугали эти цифры – как минимум 100 человек должны получать статины, чтобы предотвратить одно осложнение в течение 3 лет, или нужно провакцинировать от 80 до 120 пациентов, чтобы предотвратить один случай COVID‐19. Только не забывайте: это относится к профилактике. Показатели NNT для лечения гораздо более оптимистичные. NNT для лучевой терапии рака молочной железы равен 8, для бета-блокаторов при хронической сердечной недостаточности – 24.
Практические рекомендации
Наиболее полный онлайн-каталог NNT при различных видах лечения собран на сайте https://thennt.com/home-nnt/.
Ни одно исследование не является идеальным. Будь то рандомизированное испытание или наблюдательное исследование, никогда нельзя быть абсолютно уверенным, что результаты верны и применимы к вам. Однако, зная эффективность лечения, вы сможете задать вопросы о лечении, не демонстрирующем эффективность в исследованиях, и с осторожностью отнестись к его назначению, а также обсудить с врачом сравнительную эффективность