Ранговая корреляция


В результате формализации данных экспертными методами получается упорядоченный ряд, состоящий из рангов. Будем считать ранги случайными числами и введем для них статистику связи. Показателем связи ранжированных рядов может служить коэффициент ранговой корреляции.

Пусть n объектов ранжированы сначала по степени обладания свойством Х (ранги обозначим хi), а затем по степени обладания свойством Y (ранги обозначим yi). Ранжировки представим в виде

x1, x2, … , xn;

y1, y2, … , yn,

при этом предполагается, что выполнено условие (4.1). Коэффициент ранговой корреляции оценивает степень связи между этими рядами.

Спирмэн предложил искать оценку коэффициента ранговой корреляции в виде

clip_image002 , (4.10)

где clip_image004

В случае, если ранжировки содержат одинаковые ранги, выражение для r имеет вид

clip_image006 , (4.11)

где clip_image008 Здесь ti и ui – числа повторений i-го ранга в ранжировке по Х и Y соответственно.

Исследование распределения вероятностей коэффициента ранговой корреляции показывает, что при отсутствии связи в ранжировках распределение величины r в формуле (4.10) стремится к нормальному распределению с дисперсией clip_image010 . Поэтому для оценки значимости коэффициента r можно использовать нормальный закон распределения.

Другой коэффициент ранговой корреляции t, не связанный предпосылкой нормальности генеральной совокупности, был предложен Кендэлом. Он также вычисляется по рангам xi и yi. При этом элементы выборки располагают так, чтобы последовательность рангов одной из переменных представляла собой натуральный ряд 1,2,…,n. Для каждого i-го члена последовательности рангов второй переменной устанавливаем числа pi и qi , отражающие соответственно прямой и обратный порядок расположения последующих рангов. Затем подсчитываем суммы этих чисел P=?pi и Q=?qi , а также разность полученных сумм S=P Q. Коэффициент ранговой корреляции t представляет собой отношение этой разности к наибольшему возможному значению P и Q, т.е. к наибольшей возможной сумме pi и qi. Такая величина может быть достигнута лишь тогда, когда порядок рангов в обеих последовательностях полностью совпадают. Она равна:

clip_image012 . (4.12)

Коэффициент ранговой корреляции Кендэла можно вычислять по одной из эквивалентных формул:

clip_image014 (4.13)

или

clip_image016. (4.14)

Для определения t достаточно располагать либо величиной P, либо Q. Чаще всего в формулу подставляют ту величину, которая имеет наименьшее значение.

Расчет показателя Кендэла можно упростить следующим образом:

1) ранжируем ряд по признаку Х в возрастающем порядке с указанием соответствующих им рангов по признаку Y;

2) подсчитываем баллы для всех рангов по признаку Y. Для этого находим, сколько рангов, предшествующих каждому рангу и последующих за ним, превышают его величину. Число предшествующих превышений есть qi , число последующих превышений есть pi;

3) находим сумму баллов clip_image018, Q=?qi и разность между ними S=PQ. Далее по формулам (4.13) или (4.14).

Нельзя дать рекомендаций, какой из коэффициентов ранговой корреляции предпочтительнее на практике. Коэффициенты t и r построены по разному. При их вычислении по одной и той же последовательности чисел обычно r>t, но это ни о чем не говорит, так как оба коэффициента имеют пределы изменений от –1 до +1, а точность их не определена.

Загрузка...