Сравнение центров двух выборочных распределений |

Одна из наиболее часто встречающихся задач статистической проверки гипотез заключается в сравнении центров распределений двух нормально распределенных величин X₁ и X₂, т.е.

H₀: ₁ = ₂;

H₁: ₁ ₂;

Здесь возможны принципиально четыре различных ситуации относительно дисперсий генеральных совокупностей и

1) обе дисперсии известны и равны между собой;

2) обе дисперсии известны, но неравны между собой;

3) обе дисперсии неизвестны, но предполагается, что они равны между собой;

4) обе дисперсии неизвестны, их равенство не предполагается.

На практике в подавляющем большинстве случаев имеет место третья ситуация, которую и рассмотрим.

Для решения задачи предварительно определяются оценки математического ожидания (средние арифметические) и , а также эмпирические дисперсии и . В качестве критерия берется t-распределение Стьюдента

t = , (1.27)

где S² = — средневзвешенная дисперсия с числом степеней свободы n= n₁+n₂–2, a n₁ и n₂ – соответствующие объемы выборок.

По таблице критических значений (табл.П.2. Приложения) для выборочного уровня значимости q находим t_табл,(q,n). Если t < t_табл_,, то гипотеза H₀ о равенстве центров распределения принимается, если нет – отвергается и принимается альтернативная гипотеза H₁.

Следует отметить, что распределение Стьюдента не зависит от математического ожидания и дисперсии генеральной совокупности, зависит только от объема выборки и является аналогом нормального распределения для выборок малого объема (n < 30 – 40), при больших объемах оно практически полностью совпадает с нормальным распределением.

С помощью критерия Стьюдента можно решать задачи не только о равенстве (неравенстве) центров распределения двух выборок, но и о равенстве (неравенстве) центра распределения выборки некоторому неслучайному числу – константе (в том числе и нулю), а также о доверительных границах и интервалах. Кроме того, на основе критерия Стьюдента можно построить простой, но очень эффективный способ отсеивания так называемых грубых промахов.

При экспериментальных измерениях, особенно в цеховых или полевых условиях, нередко в массив данных вкрапливаются так называемые “грубые промахи”, которые являются результатом усталости персонала, сбоя оборудования, неполадок в технологическом процессе и т.п. Некоторые из них настолько выделяются на общем фоне, что выловить их и отбросить не составляет труда. Однако большинство грубых промахов на глаз неразличимы и поэтому могут вносить существенные искажения в результаты исследования. Для выявления и устранения грубых промахов предлагается следующая процедура.

Пусть имеется выборка объемом n, один из элементов которой X* вызвал подозрение, что он не принадлежит данной совокупности (является грубым промахом). Для всей выборки, включая X*, вычисляется среднее арифметическое и оценка дисперсии S², которые формируют нормированное отклонение

Затем вычисляется критерий отбраковки

, (1.28)

где t(q,n) – критерий Стьюдента с q уровнем значимости и n = n – 2 числом степеней свободы.

Если t<t_кр(5%,n), то подозреваемое число X* следует оставить в выборке; если t(5%,q)<t<t_кр(0,1%,q), то число X* можно оставить или выбросить по усмотрению исследователя; если t>t_кр(0,1%,n), то число X* нужно обязательно исключать из выборки.

Конечно, значения большего и меньшего уровня значимости q могут быть и другими, однако здесь приведены наиболее часто употребляемые.

Объём выборки, n	3	4	5	6	7	8	9	10	11	12
t (5%; n)	12,706	4,3027	3,1824	2,7764	2,5706	2,4469	2,3646	2,3060	2,2622	2,2281
t_кр (5%; n)	1,4098	1,6454	1,7567	1,8143	1,8481	1,8698	1,8848	1,8957	1,9039	1,9103
t (0,1%; n)	636,62	31,599	12,9240	8,6103	6,8688	5,9588	5,4079	5,0413	4,7809	4,5869
t_кр (0,1%; n)	1,4142	1,7303	1,9823	2,1781	2,3292	2,4471	2,5407	2,6163	2,6786	2,7306

Шпоры и лекции в ПГУ — студентам ПМР.