Шрифт:
Интервал:
Закладка:
5. Подвержены вариативности и суждения рентгенологов относительно рака молочной железы. Обширное исследование показало, что количество ложноотрицательных диагнозов по результатам изучения маммограмм у разных специалистов колеблется от 0 % (то есть рентгенолог неизменно правильно ставит диагноз) до величины, превышающей 50 % (рентгенолог дает неверную оценку более чем в половине случаев). Сходным образом варьируют и ложноположительные диагнозы313: от величины менее 1 % до 64 % (то есть два раза из трех рентгенолог говорит, что маммограмма свидетельствует о раке, когда злокачественного образования и в помине нет). Наличие ложных положительных и отрицательных диагнозов, поставленных различными специалистами, свидетельствует о наличии шумового фона.
Упомянутые нами случаи межэкспертного шума доминируют в результатах исследований, однако встречаются случаи и шума ситуативного. Рентгенологи порой меняют314 свою точку зрения при повторном просмотре снимка (хотя подобное явление отмечается реже, чем несогласие с оценкой коллеги). Оценивая степень закупорки сосуда на коронарограмме315, двадцать два кардиолога не могут прийти к внутреннему согласию минимум в 63 и максимум в 92 случаях из 100. В тех областях, где критерии диагностики определены расплывчато316 и диагноз требует сложного суждения, межэкспертная надежность показывает весьма скромные результаты.
Исследование, упомянутое в предыдущем абзаце, не предлагает однозначного объяснения подобного уровня ситуативного шума. Однако другой эксперимент (в котором, правда, проблемы диагностики не фигурируют)317 выявил вполне банальный источник ситуативного шума в медицине. Этот вывод следует держать в уме как пациентам, так и врачам. Итак, медики в подавляющем большинстве проявляют склонность к назначению исследований на онкологию по утрам и гораздо реже делают это после обеда. В ходе наблюдения за большим количеством специалистов выяснилось, что направления на исследования по поводу рака молочной железы и кишечника чаще всего выдают в 8:00 (в 63,7 % случаев). К 11:00 доля таких назначений снижается до 48,7 %, вновь повышаясь до 56,2 % к полудню, а затем вновь падает до 47,8 % к 17:00. Таким образом, пациенты, попадающие на прием в районе обеда и позже, получат подобное направление (между прочим, упомянутое в методических рекомендациях) с меньшей вероятностью, чем с утра.
Как объяснить подобный результат? Один из возможных ответов: врач неизбежно начинает выбиваться из графика после работы с несколькими пациентами со сложной симптоматикой, которые отнимают у него более двадцати минут стандартного приема. Мы уже говорили в главе 7 о немаловажной роли таких механизмов возникновения ситуативного шума, как стресс и усталость; похоже, что они срабатывают и здесь. Пытаясь войти в график, доктор сокращает время беседы с очередным пациентом, пропуская рассказ о профилактических мерах. Любопытный пример ситуативного шума: в конце смены клинический специалист реже и менее тщательно моет руки – вот и еще одно доказательство той роли318, которую играет усталость. Даже в такой несложной процедуре мы наблюдаем воздействие шума.
Значение методических рекомендаций: снижение шума в медицине
Подробные исследовательские материалы, посвященные наличию и распространению шума в различных отраслях медицины, стали бы серьезным подспорьем319 и в иных сферах. Мы о подобных публикациях не слышали, однако надеемся, что их время еще придет. Тем не менее даже немногочисленные доступные нам отчеты дают ключ к пониманию проблемы.
Диагностика одних недомоганий и болезней носит преимущественно механический характер, не оставляя места суждению, и это первая крайность. В некоторых случаях диагнозы ставятся не механически, но в достаточно однозначном контексте, когда любой специалист с высокой вероятностью поддержит суждение коллег. Бывают и ситуации, когда высокая квалификация врача станет достаточной гарантией снижения шума до минимальных значений. Отметим и другую крайность: периодически у врача появляется огромный простор для вынесения индивидуального суждения, поскольку существенные критерии диагностики носят неконкретный характер; в этом случае уровень шума будет значителен, и снизить его крайне сложно. Дальше мы увидим, что примером подобной крайности является психиатрия.
Какие методы подавления шума сработают в медицине? Мы уже говорили, что обучение320 развивает навыки, которые помогут врачу в дальнейшем. Той же цели служит и обобщение321 мнений экспертов (мы имеем в виду, например, «второе мнение»). Многообещающим направлением представляется составление алгоритмов. Врачи уже сегодня применяют искусственный интеллект и самообучающиеся программы, которые способны снизить шумовой фон. В частности, алгоритмы используются при выявлении метастазов в лимфузлах у женщин, страдающих раком молочной железы. Выясняется, что лучшие из подобных программ322 дадут фору даже классному специалисту лабораторной диагностики; кроме того, алгоритм не подвержен шуму. Самообучающиеся алгоритмы с определенным успехом работают также323 при выявлении связанных с диабетом глазных заболеваний. Уже сегодня искусственный интеллект по крайней мере не хуже324 рентгенолога диагностирует рак по показаниям маммограмм, а дальнейшая эволюция, вероятно, покажет и полное его превосходство.
Полагаем, что в будущем медики все больше станут полагаться на алгоритмы, так как искусственный интеллект снижает и эффект смещения, и шум, спасая тем самым жизни людей и экономя деньги. Однако мы пока сделаем акцент на методических рекомендациях, так как медицина – как раз тот самый пример, где налицо хорошие и даже отличные результаты в ряде сфер их применения (хотя в некоторых случаях наблюдаются смешанные результаты).
Вероятно, самым известным примером методических рекомендаций по диагностике стала шкала «Апгар», предложенная акушером-анестезиологом Вирджинией Апгар еще в 1952 году. Раньше при оценке возможных патологий развития новорожденных врачи и фельдшеры прибегали исключительно к клиническим суждениям. Шкала «Апгар» вооружила их стандартными методическими рекомендациями. Пользуясь данным способом, врач оценивает цвет кожных покровов, частоту сокращений сердечной мышцы, рефлексы и мышечный тонус, а также дыхательные усилия младенца. В английском языке само название методики является аббревиатурой из первых букв упомянутых признаков. Итак, исследование по методу «Апгар» дает оценку каждому из пяти критериев в диапазоне от 0 до 2. Наивысшим совокупным баллом является значение 10, однако подобный результат – большая редкость. Чаще всего оценка 7 и выше считается признаком хорошего состояния малыша.
Таблица 3325.Методические указания по применению шкалы «Апгар»
Следует отметить, что частота сокращения сердечной мышцы – единственный критерий, оценка которому дается в количественном выражении; остальные же показатели