litbaza книги онлайнРазная литератураИнтернет-журнал "Домашняя лаборатория", 2008 №7 - Журнал «Домашняя лаборатория»

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 79 80 81 82 83 84 85 86 87 ... 192
Перейти на страницу:
росло число инфицированных ВИЧ-инфекцией и больных СПИД. Но при очень высокой корреляции уровней обоих рядов никакой реальной связи процессов нет. Это один из видов ложной корреляции. Как же отличить ложную корреляцию от истинной? Конечно, прежде всего, как и при изучении связей в пространственной совокупности, нужно обосновать связь по существу, объяснить ее причинный механизм. Эта задача не статистическая, поэтому в данном учебнике не рассматривается. Она решается специалистом в той сфере знаний, которая изучает объект, процесс, — агрономом, инженером, экономистом, социологом, биохимиком, астрономом и т. д. Без причинного обоснования лучше не начинать измерение связи в динамике.

Но даже и после такого обоснования остается открытым вопрос: при наличии одинаково направленных трендов двух причинно-связанных признаков не преувеличится ли теснота связи за счет трендов? Если, например, в стране растет производство и применение минеральных удобрений, растет и урожайность сельскохозяйственных культур, но последняя растет не только по причине увеличения применения удобрений, а также и за счет других факторов — селекции новых сортов, мелиорации, орошения, механизации производства, роста экономической заинтересованности фермеров и др. А при коррелировании уровней урожайности и доз удобрений за 20–25 лет прогресс всех факторов урожайности будет отнесен на дозу удобрений. Получится коэффициент детерминации, превышающий 50 или даже 70 %, и где гарантия, что к истинной корреляции и здесь не примешана ложная? Такой гарантии нет.

Могут возразить: «А разве не может так случиться, что и в пространственной совокупности предприятий, у тех из них, которые вносят большие дозы минеральных удобрений, одновременно и семена лучше, и сельскохозяйственные машины, и кадры более подготовлены, и экономика сильнее?» Да, это возможно, но именно лишь возможно, как возможно и несовпадение факторов, влияющих на урожайность. А параллельная тенденция динамики факторов во времени — это не просто возможность, а в 90 % стран и регионов — достоверный факт. Так что примесь ложной корреляции в пространственных совокупностях намного меньше, чем при коррелировании временных рядов. И, следовательно, если есть возможность изучать, измерять, моделировать связь результативного признака с его факторами не по рядам динамики, а в пространственной совокупности, это обязательно следует делать.

Проблема ложной корреляции почти целиком снимается, если причинная связь обоснована не столько между тенденциями динамики, сколько между колебаниями факторного и результативного признаков. Например, колебания урожайности во влагонедостаточных регионах, например, таких, как Оренбургская область, причинно связаны не с какой-либо тенденцией изменения суммы осадков, а с ее колебаниями в отдельные годы. К тенденции же роста урожайности осадки никакого отношения (причинной связи) не имеют. Снимается ложная корреляция тем, что колебания других факторов, влияющих на урожайность, — экономических, организационных — не связаны или слабо связаны с колебаниями осадков. Тенденции факторов связаны часто, колебания — почти никогда. Поэтому связь между колебаниями одного фактора с результативным показателем (его колебаниями) почти всегда свободна от ложной корреляции, наведенной другими факторами.

В последующих разделах данной главы в основном будут рассматриваться корреляция между колебаниями признаков, а также методики ее измерения и моделирования. Что же касается измерения связи между тенденциями, между самими уровнями временных рядов, включающих тенденцию, а не только колебания, то эта проблема не может считаться решенной. Некоторые указания читатели учебника могут найти в разделе о смешанных прогностических моделях (гл. 10). Излагаемые здесь методики решают только ограниченный класс задач — измерение связи между колебаниями факторного (факторных) признака и колебаниями результативного признака.

Строго говоря, это жесткое ограничение относится и к пространственной корреляции в том смысле, что и в ней измеряется связь вариации результативного признака с вариацией фактора. Например, за счет вариации дозы минеральных удобрений объясняется 38 % вариации урожайности пшеницы между хозяйствами области (r2 = 0,38), а не 38 % уровня урожайности, как иногда неверно считают.

9.4. Методы измерения корреляции между колебаниями признаков

Итак, в предыдущем разделе было установлено, что единственная «чистая» задача об измерении корреляции временных рядов — это измерение связи между колебаниями их уровней. Колебания — это, как правило, случайная составляющая, в отличие от тренда. Если же и колебания не случайны, а строго упорядочены, как, например, сезонные, то и задача о связи таких колебаний не является «чистой», так как содержит риск ложной связи. В связи с этим далее рассматриваются лишь случайно распределенные во времени колебания, например колебания урожайности.

Классический пример, иллюстрирующий отличие корреляции отклонений от тренда и корреляции уровней ряда, — это связь, наблюдавшаяся в 1970–1989 гг. в СССР между урожайностью сельскохозяйственных культур и себестоимостью единицы их продукции. Урожайность большинства культур в подавляющей части регионов в 70–80 % хозяйств имела тенденцию роста, хотя и медленного, а в отдельных хозяйствах — довольно быстрого. Согласно законам экономики, как рыночной, так и плановой, рост урожайности должен приводить к снижению себестоимости единицы продукции. Однако на самом деле в большинстве, если не во всех хозяйствах и регионах, наоборот, себестоимость имела тенденцию роста. Скрытой причиной этого явления была не признаваемая официально инфляция — рост цен на все элементы затрат на производство: сельскохозяйственные машины, энергоносители, удобрения. Рассмотрим пример, представленный в табл. 9.3.

Средние: х‾ =119,92 ~= 120; у‾ = 19,0.

Уравнения трендов:

урожайности: х^ = 119,9 + 3,81t;

себестоимости: у^ = 19,0 + 1,22t, где t = 0 в 1983 г.

Если рассчитывать коэффициент корреляции между уровнями рядов по обычной формуле

то получаем величину -0,055, незначимо отличную от нуля. Параллельность трендов урожайности и себестоимости погасила обратную связь их колебаний, что привело к результату, противоречащему законам экономики.

Рассмотрим теперь другую методику: измерение корреляции между отклонениями уровней от трендов. Подставляя отклонения от трендов в обычную формулу коэффициента корреляции, имеем:

Однако так как средние величины отклонений от линейных и параболических трендов всегда равны нулю, а от других форм тренда близки к нулю, если эти формы трендов правильно выбраны, то

U‾x = U‾y = 0

и формула приобретает вид:

Соответственно формула коэффициента регрессии также меняется:

Свободный член уравнения регрессии определяем по обычной формуле: а = у‾ — Ьх, т. е. для отклонений от трендов: а = U‾ybU‾x = 0

Уравнение регрессии имеет вид:

UYi = bUXi (9.10)

Подставляя данные из табл. 9.3, получаем:

rUxUy = -952,7/√(7678∙133,3) = -0,9414; r2 = 88%

Таким образом, колебания себестоимости картофеля в совхозе почти целиком были связаны с колебаниями

1 ... 79 80 81 82 83 84 85 86 87 ... 192
Перейти на страницу:

Комментарии
Минимальная длина комментария - 20 знаков. Уважайте себя и других!
Комментариев еще нет. Хотите быть первым?