В результате формализации данных экспертными методами получается упорядоченный ряд, состоящий из рангов. Будем считать ранги случайными числами и введем для них статистику связи. Показателем связи ранжированных рядов может служить коэффициент ранговой корреляции.
Пусть n объектов ранжированы сначала по степени обладания свойством Х (ранги обозначим хi), а затем по степени обладания свойством Y (ранги обозначим yi). Ранжировки представим в виде
x1, x2, … , xn;
y1, y2, … , yn,
при этом предполагается, что выполнено условие (4.1). Коэффициент ранговой корреляции оценивает степень связи между этими рядами.
Спирмэн предложил искать оценку коэффициента ранговой корреляции в виде
В случае, если ранжировки содержат одинаковые ранги, выражение для r имеет вид
где
Здесь ti и ui – числа повторений i-го ранга в ранжировке по Х и Y соответственно.
Исследование распределения вероятностей коэффициента ранговой корреляции показывает, что при отсутствии связи в ранжировках распределение величины r в формуле (4.10) стремится к нормальному распределению с дисперсией
. Поэтому для оценки значимости коэффициента r можно использовать нормальный закон распределения.
Другой коэффициент ранговой корреляции t, не связанный предпосылкой нормальности генеральной совокупности, был предложен Кендэлом. Он также вычисляется по рангам xi и yi. При этом элементы выборки располагают так, чтобы последовательность рангов одной из переменных представляла собой натуральный ряд 1,2,…,n. Для каждого i-го члена последовательности рангов второй переменной устанавливаем числа pi и qi , отражающие соответственно прямой и обратный порядок расположения последующих рангов. Затем подсчитываем суммы этих чисел P=?pi и Q=?qi , а также разность полученных сумм S=P — Q. Коэффициент ранговой корреляции t представляет собой отношение этой разности к наибольшему возможному значению P и Q, т.е. к наибольшей возможной сумме pi и qi. Такая величина может быть достигнута лишь тогда, когда порядок рангов в обеих последовательностях полностью совпадают. Она равна:
Коэффициент ранговой корреляции Кендэла можно вычислять по одной из эквивалентных формул:
или
Для определения t достаточно располагать либо величиной P, либо Q. Чаще всего в формулу подставляют ту величину, которая имеет наименьшее значение.
Расчет показателя Кендэла можно упростить следующим образом:
1) ранжируем ряд по признаку Х в возрастающем порядке с указанием соответствующих им рангов по признаку Y;
2) подсчитываем баллы для всех рангов по признаку Y. Для этого находим, сколько рангов, предшествующих каждому рангу и последующих за ним, превышают его величину. Число предшествующих превышений есть qi , число последующих превышений есть pi;
3) находим сумму баллов
, Q=?qi и разность между ними S=P—Q. Далее по формулам (4.13) или (4.14).
Нельзя дать рекомендаций, какой из коэффициентов ранговой корреляции предпочтительнее на практике. Коэффициенты t и r построены по разному. При их вычислении по одной и той же последовательности чисел обычно r>t, но это ни о чем не говорит, так как оба коэффициента имеют пределы изменений от –1 до +1, а точность их не определена.
