Для теоретических законов распределения их параметры – математическое ожидание M[X] и дисперсия s2 не являются случайными величинами, а имеют единственное (точечное) значение и вполне определенный смысл. Так для нормального закона распределения математическое ожидание M[X] является не только центром распределения (площадь левой части фигуры, ограниченная кривой и осью абcцисс, равна площади правой ее части), но и медианой (серединой размаха) и модой (точкой проекции вершины на ось абcцисс), а дисперсия s2 может рассматриваться как квадрат среднеквадратичного отклонения s, которое есть расстояние между математическим ожиданием и проекцией на ось абcцисс точки перегиба кривизны кривой f (X), т.е. точки, в которой вторая производная функции обращается в нуль.
Если обратиться к таким же по смыслу параметрам выборочного распределения – средней арифметической
и эмпирической дисперсии S2, то, как показали теоретические исследования, они, являясь по своей природе случайными величинами, тем не менее наиболее точно описывают неслучайные величины M[X] и s2 и поэтому носят название оценок параметров соответствующих теоретических законов распределения (или, если угодно, генеральных совокупностей).
Все многообразие кривых нормального распределения можно свести к одной единственной кривой, если вместо реальной переменной X ввести нормированную и центрированную переменную (квантиль)
Тогда выражение (1.17) преобразуется к виду
Такой вид выражения плотности вероятности нормального распределения способствует быстрому решению многих задач, в том числе задачи о совпадении эмпирического и теоретического распределения. Наиболее точно это можно сделать с помощью сопоставления так называемых выравнивающих частот и частот гистограммы выборочного распределения.
Дальнейшие рассуждения будем подкреплять данными примера.
Выравнивающие частоты, то есть частоты, которые должны быть при нормальном (согласно нашей гипотезе) распределении для тех же аргументов, для которых у нас уже имеются выборочные частоты, наиболее просто подсчитать по формуле
где
=(
j —
)/S — центрированный и нормированный аргумент (квантиль);
0=CN/(S
) — масштабное число, которое служит для приведения теорети-
ческих значений нормального распределения к масштабу нашего опыта (чтобы
эмпирическую и теоретическую кривые можно было сравнивать между собой).
Для большей наглядности следует совместить на одном рисунке выборочные и выравнивающие частоты. Для этого на рис.1.3. переносится полигон выборочного распределения из рис.1.1., а затем здесь же откладываются выравнивающие частоты, которые получаются вычислением по формуле (1.20) для каждого j-го разряда гистограммы.
Для того, чтобы оценить степень приближения выборочного распределения к теоретической кривой, которая теперь представлена выравнивающим распределением, и в конечном счете доказать правильность или неправильность этого выбора, воспользуемся одним из критериев согласия – критерием P(c2).
Величина c2 вычисляется по формуле:
где nj – наблюденные, а
j – выравнивающие частоты.
|
|
Рис.1.3. Частота выборочного (1) и выравнивающего (2) распределения
Пример вычисления представлен в табл.1.2. Величина c2 является конкретным числовым значением ряда распределения c2-Пирсона, вероятность совпадения которого с теоретическим распределением и является мерой критерия согласия. Другими словами, вероятность того, что вычисленная величина c2 совпадает с табличной и есть вероятность совпадения выборочного распределения с гипотетическим (в нашем случае с нормальным). Таблица вероятностей P(c2) представлена в табл.П.1. Приложения.
При употреблении критерия согласия P(c2) важное значение имеет правильный подсчет числа степеней свободы. Следует помнить, что критерий P(c2) применим в тех случаях, когда количество опытов достаточно велико (порядка сотен), а в каждом разряде число наблюдений nj составляет величину не менее 5 (если число данных в крайних разрядах гистограммы меньше 5, то разряды следует объединить. Эта особенность учтена в табл.1.2.).
Второй особенностью метода является условие приблизительного равенства объема всей выборки и суммы выравнивающих частот, то есть
В случае, если эти величины значительно (более чем на 1) отличаются друг от друга, необходимо ввести в гистограмму дополнительные фиктивные разряды, в которых частоты nj = 0, а выравнивающие частоты
j вычисляются в соответствии с формулой (1.20). Количество этих разрядов и их местоположение (в начале или в конце табл.1.2) должны обеспечивать максимально быстрое выполнение приближенного равенства (1.22).
