Нормальный закон распределения


Для теоретических законов распределения их параметры – математическое ожидание M[X] и дисперсия s2 не являются случайными величинами, а имеют единственное (точечное) значение и вполне определенный смысл. Так для нормального закона распределения математическое ожидание M[X] является не только центром распределения (площадь левой части фигуры, ограниченная кривой и осью абcцисс, равна площади правой ее части), но и медианой (серединой размаха) и модой (точкой проекции вершины на ось абcцисс), а дисперсия s2 может рассматриваться как квадрат среднеквадратичного отклонения s, которое есть расстояние между математическим ожиданием и проекцией на ось абcцисс точки перегиба кривизны кривой f (X), т.е. точки, в которой вторая производная функции обращается в нуль.

Если обратиться к таким же по смыслу параметрам выборочного распределения – средней арифметической clip_image002 и эмпирической дисперсии S2, то, как показали теоретические исследования, они, являясь по своей природе случайными величинами, тем не менее наиболее точно описывают неслучайные величины M[X] и s2 и поэтому носят название оценок параметров соответствующих теоретических законов распределения (или, если угодно, генеральных совокупностей).

Все многообразие кривых нормального распределения можно свести к одной единственной кривой, если вместо реальной переменной X ввести нормированную и центрированную переменную (квантиль)

clip_image004 = clip_image006. (1.18)

Тогда выражение (1.17) преобразуется к виду

f(clip_image004[1]) = clip_image008exp clip_image010, (1.19)

в котором M [clip_image012] = 0, a clip_image014[clip_image012[1]] = 1.

Такой вид выражения плотности вероятности нормального распределения способствует быстрому решению многих задач, в том числе задачи о совпадении эмпирического и теоретического распределения. Наиболее точно это можно сделать с помощью сопоставления так называемых выравнивающих частот и частот гистограммы выборочного распределения.

Дальнейшие рассуждения будем подкреплять данными примера.

Выравнивающие частоты, то есть частоты, которые должны быть при нормальном (согласно нашей гипотезе) распределении для тех же аргументов, для которых у нас уже имеются выборочные частоты, наиболее просто подсчитать по формуле

clip_image016, (1.20)

где clip_image012[2]=(clip_image002[1]jclip_image002[2])/S — центрированный и нормированный аргумент (квантиль);

clip_image0200=CN/(Sclip_image022) — масштабное число, которое служит для приведения теорети-

ческих значений нормального распределения к масштабу нашего опыта (чтобы

эмпирическую и теоретическую кривые можно было сравнивать между собой).

Для большей наглядности следует совместить на одном рисунке выборочные и выравнивающие частоты. Для этого на рис.1.3. переносится полигон выборочного распределения из рис.1.1., а затем здесь же откладываются выравнивающие частоты, которые получаются вычислением по формуле (1.20) для каждого j-го разряда гистограммы.

Для того, чтобы оценить степень приближения выборочного распределения к теоретической кривой, которая теперь представлена выравнивающим распределением, и в конечном счете доказать правильность или неправильность этого выбора, воспользуемся одним из критериев согласия – критерием P(c2).

Величина c2 вычисляется по формуле:

clip_image024, (1.21)

где nj – наблюденные, а clip_image026j – выравнивающие частоты.

clip_image028

Рис.1.3. Частота выборочного (1) и выравнивающего (2) распределения

Пример вычисления представлен в табл.1.2. Величина c2 является конкретным числовым значением ряда распределения c2-Пирсона, вероятность совпадения которого с теоретическим распределением и является мерой критерия согласия. Другими словами, вероятность того, что вычисленная величина c2 совпадает с табличной и есть вероятность совпадения выборочного распределения с гипотетическим (в нашем случае с нормальным). Таблица вероятностей P(c2) представлена в табл.П.1. Приложения.

При употреблении критерия согласия P(c2) важное значение имеет правильный подсчет числа степеней свободы. Следует помнить, что критерий P(c2) применим в тех случаях, когда количество опытов достаточно велико (порядка сотен), а в каждом разряде число наблюдений nj составляет величину не менее 5 (если число данных в крайних разрядах гистограммы меньше 5, то разряды следует объединить. Эта особенность учтена в табл.1.2.).

Второй особенностью метода является условие приблизительного равенства объема всей выборки и суммы выравнивающих частот, то есть

N = clip_image030. (1.22)

В случае, если эти величины значительно (более чем на 1) отличаются друг от друга, необходимо ввести в гистограмму дополнительные фиктивные разряды, в которых частоты nj = 0, а выравнивающие частоты clip_image020[1]j вычисляются в соответствии с формулой (1.20). Количество этих разрядов и их местоположение (в начале или в конце табл.1.2) должны обеспечивать максимально быстрое выполнение приближенного равенства (1.22).