Метод сравнения двух распределений


Следует отметить, что метод сравнения двух распределений с помощью c2-критерия Пирсона является универсальным и не зависит от формы сравниваемых кривых, лишь бы количество опытных данных было бы достаточно велико. Позже мы неоднократно будем прибегать к c2-распределению, которое встречается почти так же часто для случая распределения квадратичных величин, как нормальное распределение для линейных.

Так как мы доказали, что гипотеза о нормальном законе распределения не противоречит данным опыта, можно воспользоваться теоретическим выражением функции плотности вероятности (1.17), подставляя в которое оценочные параметры clip_image002 и S, рассчитанные по опытным данным, получим аналитическое выражение дифференциального закона распределения для конкретной выборки. Для нашего примера после числовых преобразований

f(X) = 0,0083exp{-2,025clip_image004-4(X – 237,6)2}.

На практике часто приходится решать задачу о вероятности нахождения величины X в некоторых заданных пределах Xв (верхний предел) и Xн (нижний предел), На основе знания функции f(Х) такую задачу легко решить из общих соображений интегрального исчисления

clip_image006, (1,24)

однако именно для нормального закона распределения этот интеграл в элементарных функциях не берется, и его следует определить численными методами, например, с использованием нормированной функции Лапласа. Выражение (1.24) в этом случае преобразуется:

P(Xн < X < Xв) = clip_image008, (1.25)

где F(x) – нормированная функция Лапласа, которая представлена в табл.П.3 Приложения.

Для нашего примера вероятность нахождения величины X в каком-либо интервале, например в 3-м и 4-м разрядах гистограммы, равна

clip_image010; clip_image012;

clip_image014; clip_image016;

P(Xн < X < Xв) = Ф(x2) – Ф(x1) = 0,2864.

Для сравнения подсчитаем суммарную частость (относительную частоту) в том же интервале, определенную прямо на гистограмме. Она равна p3,4 = (n3+n4)/ /N=(23+37)/176 = 0,3409, что на 19% отличается от теоретического значения. Объяснение этому обстоятельству легко найти при исследовании кривых рис.1.3.

Так как функция плотности вероятности f(X) для нормального закона распределения не имеет четко выраженных границ существования (теоретически считается, что она определена на всей числовой оси от -? до +?), то возникает непростой вопрос о связи между площадью подинтегральной кривой (т.е. вероятностью) и допустимыми границами существования случайной величины X.

clip_image018

Рис.1.4. Связь между полями допуска и доверительной вероятностью

Проще всего этот вопрос, опираясь на интегральный закон распределения (1.24), рассмотреть применительно к полю допуска размера некоторой механической детали, изготавливаемой по массовой технологии.

При назначении поля допуска по вероятностному закону конструктор (технолог) обязан связать его с одним из параметров этого закона. В случае нормального закона распределении и двустороннего симметричного допуска наиболее просто это сделать через среднеквадратичное отклонение

clip_image020Х = xдов,clip_image022. (1.26)

где xдов — некоторый коэффициент пропорциональности. Выбор величины xдов тесно связан с доверительной вероятностью, которая численно равна площади, заключенной между кривой распределения и осью абсцисс в пределах выбранного допуска (рис.1.4). Доверительную вероятность можно трактовать как вероятность получения правильного ответа (попадания деталей в допуск при массовом производстве, процент выхода годных изделий и т.п.), а сопряженную с ней величину q=1-Pдов как уровень значимости (процент ошибки) принятого решения. Величину q исследователь выбирает сам исходя из того, к какой предметной области относится задача (для сельскохозяйственного производства q=10%, для медицины q=0,1% и меньше). Как правило, в технических приложениях принято пользоваться величиной уровня значимости q=5%.Так как коэффициент пропорциональности clip_image024дов в сущности является квантилью нормального распределения, то найти его можно, пользуясь табл.П.3 Приложения.

Чем больше xдов, тем больше Pдов, т.е. увеличивается процент выхода годных изделий, но увеличивается и поле допуска, что может привести к невозможности сочленять данное изделие с другими. Таким образом, допуск всегда есть компромисс между этими противоположными стремлениями. Обычно (но вовсе не обязательно) назначается допуск clip_image020[1]X =3S (Pдов=0,9973, уровень значимости 0,27%), так как здесь оба требования, как правило, удовлетворяются. Однако на практике чаще используется xдов=1,96, что соответствует Pдов=0,95 или уровню значимости q=5%. При этом надо четко понимать, что ошибка в выводах, соответствующая уровню значимости q, присуща самой природе статистических вычислений и имеется всегда, какой бы малой ее не старался сделать исследователь.