Корреляция случайных величинСтраница 1
Прямое токование термина корреляция
— стохастическая, вероятная, возможная связь
между двумя (парная) или несколькими (множественная) случайными величинами.
Выше говорилось о том, что если для двух СВ (X
и Y
) имеет место равенство P(XY) =P(X) P(Y)
, то величины X
и Y
считаются независимыми. Ну, а если это не так!?
Ведь всегда важен вопрос — а как сильно зависит одна СВ от другой? И дело в не присущем людям стремлении анализировать что-либо обязательно в числовом измерении. Уже понятно, что системный анализ означает непрерывные выЧИСЛения, что использование компьютера вынуждает нас работать с числами, а не понятиями.
Для числовой оценки возможной связи между двумя случайными величинами: Y
(со средним My
и среднеквадратичным отклонением Sy
) и — X
(со средним Mx
и среднеквадратичным отклонением Sx
) принято использовать так называемый коэффициент корреляции
R
xy
=
. {2 - 11}
Этот коэффициент может принимать значения от -1 до +1 — в зависимости от тесноты связи между данными случайными величинами.
Если коэффициент корреляции равен нулю, то X
и Y
называют некоррелированными
. Считать их независимыми обычно нет оснований — оказывается, что существуют такие, как правило — нелинейные связи величин, при которых Rxy = 0
, хотя величины зависят друг от друга. Обратное всегда верно — если величины независимы
, то Rxy
= 0
. Но, если модуль Rxy
= 1, то есть все основания предполагать наличие линейной связи между Yи X
. Именно поэтому часто говорят о линейной корреляциипри использовании такого способа оценки связи между СВ.
Отметим еще один способ оценки корреляционной связи двух случайных величин — если просуммировать произведения отклонений каждой из них от своего среднего значения, то полученную величину —
Сxy=
S
(X - Mx)
·(Y - My)
или ковариациювеличин X
и Y
отличает от коэффициента корреляции два показателя:
во-первых, усреднение (деление на число наблюдений или пар X
, Y
) и, во-вторых, нормирование путем деления на соответствующие среднеквадратичные отклонения.
Такая оценка связей между случайными величинами в сложной системе является одним из начальных этапов системного анализа, поэтому уже здесь во всей остроте встает вопрос о доверии к выводу о наличии или отсутствии связей между двумя СВ.
В современных методах системного анализа обычно поступают так. По найденному значению R
вычисляют вспомогательную величину:
W = 0.5 Ln[(1 + R)/(1-R)]
{2 - 12}
и вопрос о доверии к коэффициенту корреляции сводят к доверительным интервалам для случайной величины W, которые определяются стандартными таблицами или формулами.
В отдельных случаях системного анализа приходится решать вопрос о связях нескольких (более 2) случайных величин или вопрос о множественной корреляции.
Другое по теме
2. Скалигер и Петавиус. Создание в XVI–XVII веках общепринятой ныне
версии хронологии и истории древности и Средневековья
Хронология древней и средневековой истории в том виде, в
каком мы имеем ее сейчас, создана и в значительной мере завершена в серии
фундаментальных трудов XVI–XVII веков, начинающейся трудами ИОСИФА СКАЛИГЕРА
(1540–1609) (Ioseph ...