Шрифт:
Интервал:
Закладка:
Рис. 6.1. Кофеин – общая причина учащения пульса и недосыпания, однако ЧСС также напрямую влияет на сон
Хотя практически любой метод, основанный на данных наблюдения, допускает, что нет никаких скрытых общих причин, на практике редко можно быть уверенным в этом. Заметим, однако: мы не обязаны допускать, что измерена каждая причина – только общие.
На рис. 6.2 (а) показано, что кофеин изменяет как качество сна, так и сердечный ритм; алкоголь вызывает аналогичный эффект. Не располагая данными по потреблению алкоголя, мы не сумеем выявить эту причину изменений сна, однако в результате не будут сделаны некорректные выводы об их взаимоотношениях. Аналогично, если кофе воздействует на сон посредством промежуточной переменной, отношения будут примерно такими: кофеин вызывает повышенное сердцебиение, а оно провоцирует недосып (рис. 6.2 (б)), и если при этом мы не измеряем сердцебиение, то просто найдем более неявную причину, а не некорректную структуру. Таким образом, необязательно наблюдать каждое индивидуальное звено в каузальной цепи.
Рис. 6.2. Если алкоголь (слева) и сердцебиение (справа) не измерены, это не ведет к искажению связи между кофеином и сном
Некоторые вычислительные методы исходят из допущения, что все общие причины измерены, и определяют, в каких случаях может существовать невыявленная причина, или иногда помогают обнаружить саму причину. Однако это, как правило, возможно только при очень жестких условиях и затруднительно при наличии комплексных временных рядов[231]. Но как быть, если мы не знаем, что все общие причины измерены, и не в состоянии применить эти методы для выяснения причин?
В методах графических моделей, о которых мы поговорим далее, доступно только одно: найти все возможные модели, соответствующие данным, включая те, которые имеют скрытые переменные.
К примеру, если мы найдем видимую причинную зависимость между сном и сердцебиением и при этом будем знать, что могут существовать неизмеренные причины обоих факторов, то одной из возможных моделей будет скрытая переменная, которая вызывает оба наблюдаемых фактора. Преимущество в том, что иногда возникают некие общие для всех моделей взаимосвязи, объясняющие имеющиеся данные. Тогда, даже когда есть множество возможных структур, нетрудно вывести некие заключения относительно потенциальных корреляций.
Во всех случаях, однако, уверенность в выводах о каузальных взаимосвязях должна быть пропорциональна убежденности, что нет никакой потенциально неизмеренной причины, а заключение, сделанное на основе данных наблюдения, может стать точкой отсчета для будущих экспериментов, которые подтвердят его или опровергнут.
Репрезентативное распределение
Помимо уверенности, что мы располагаем верным набором переменных, необходимо также знать, что наблюдаемые события отражают истинное поведение системы. По существу, если нет сведений, что наличие тревожной сигнализации становится причиной ограблений, нужно верить, что – при наших данных – ограбления зависят от отсутствия системы сигнализации.
Мы уже изучили несколько ситуаций, когда сведения не были репрезентативными: 1) анализ данных в ограниченном диапазоне не позволил выявить корреляции между интенсивностью учебы и экзаменационными баллами (глава 3); 2) парадокс Симпсона стал причиной исчезновения или обращения вспять причинно-следственных связей между лекарствами и исходом заболеваний в зависимости от того, брались данные агрегированно или изучались отдельно для мужчин и женщин (глава 5).
Также мы видели пример, как можно нивелировать взаимозависимости, чтобы выявлять причинности без корреляций. В главе 3 мы наблюдали две цепочки между занятиями бегом и потерей веса, когда бег давал положительный эффект и отрицательный, поскольку занятия спортом вызывали повышенный аппетит. При неудачном распределении это значит, что мы можем вообще не обнаружить никакой взаимосвязи между пробежками и потерей веса. Поскольку осмысление причинности зависит от наблюдения реальных зависимостей, мы, как правило, вынуждены делать допущение, что такого типа нивелирования нет. Подобное допущение часто называют верностью (речь о видах ассоциации), поскольку данные, не отражающие истинную структуру, на которой все построено, в некотором смысле ей «неверны».
Кое-кто утверждает, что такой тип нарушения связи редок[232], но на деле некоторые системы – к примеру, биологические – структурированы так, что практически гарантируют нарушение. Когда множественные гены продуцируют фенотип, даже если мы возьмем за основу неактивный ген, фенотип по-прежнему будет присутствовать, что приведет к видимой зависимости между причиной и следствием. Многие системы, вынужденные поддерживать равновесие, включают подобного рода резервные причины.
И все же нам даже не нужна точная нивелировка или вообще какая-либо зависимость, чтобы нарушить допущения о верности. Это потому, что на практике большинство вычислительных методов требует выбирать статистический предел, на основании которого зависимость будет принята или отвергнута (здесь используются p-значения или другие критерии). Вероятность следствия не должна быть в точности равна его вероятности под условием причины – просто достаточно близка, чтобы результат оставался в пределах допустимого. Например, вероятность потери веса после пробежки может не равняться вероятности потери веса вообще, без бега, однако может привести к нарушению допущения о верности, если отличие будет незначительным[233].
* * *
Еще один вариант нерепрезентативности распределения, касающегося истинного набора зависимостей, – смещение выборки. Скажем, есть данные из больницы, куда включены диагнозы и результаты лабораторных испытаний. Однако один из тестов крайне дорогой, поэтому врачи просят сделать его только в том случае, если у пациента необычная картина болезни и другим способом диагноз поставить нельзя. В большинстве случаев тест дает положительный результат. Из этих наблюдений, однако, нельзя узнать истинную вероятность такого исхода, потому что тест заказывают только при высоких шансах на положительный ответ. По результатам медицинских проверок мы, как правило, видим лишь ограниченный диапазон данных – например, когда измерения делаются только у самых больных пациентов (как инвазивный мониторинг в отделении интенсивной терапии). Диапазон наблюдаемых значений включает заболевших, состояние которых достаточно плохое для проведения подобного мониторинга. Ситуация проблематичная, поскольку это значит, что, если мы выявим причинную зависимость для такой ограниченной группы, она может не быть истинной для населения в целом. Аналогично можно не распознать истинную зависимость из-за отсутствия в выборке вариации.