Одна из наиболее часто встречающихся задач статистической проверки гипотез заключается в сравнении центров распределений двух нормально распределенных величин X1 и X2, т.е.
Здесь возможны принципиально четыре различных ситуации относительно дисперсий генеральных совокупностей
и ![]()
1) обе дисперсии известны и равны между собой;
2) обе дисперсии известны, но неравны между собой;
3) обе дисперсии неизвестны, но предполагается, что они равны между собой;
4) обе дисперсии неизвестны, их равенство не предполагается.
На практике в подавляющем большинстве случаев имеет место третья ситуация, которую и рассмотрим.
Для решения задачи предварительно определяются оценки математического ожидания (средние арифметические)
и
, а также эмпирические дисперсии
и
. В качестве критерия берется t-распределение Стьюдента
где S2 =
— средневзвешенная дисперсия с числом степеней свободы n= n1+n2–2, a n1 и n2 – соответствующие объемы выборок.
По таблице критических значений (табл.П.2. Приложения) для выборочного уровня значимости q находим tтабл,(q,n). Если t < tтабл,, то гипотеза H0 о равенстве центров распределения принимается, если нет – отвергается и принимается альтернативная гипотеза H1.
Следует отметить, что распределение Стьюдента не зависит от математического ожидания и дисперсии генеральной совокупности, зависит только от объема выборки и является аналогом нормального распределения для выборок малого объема (n < 30 – 40), при больших объемах оно практически полностью совпадает с нормальным распределением.
С помощью критерия Стьюдента можно решать задачи не только о равенстве (неравенстве) центров распределения двух выборок, но и о равенстве (неравенстве) центра распределения выборки некоторому неслучайному числу – константе (в том числе и нулю), а также о доверительных границах и интервалах. Кроме того, на основе критерия Стьюдента можно построить простой, но очень эффективный способ отсеивания так называемых грубых промахов.
При экспериментальных измерениях, особенно в цеховых или полевых условиях, нередко в массив данных вкрапливаются так называемые “грубые промахи”, которые являются результатом усталости персонала, сбоя оборудования, неполадок в технологическом процессе и т.п. Некоторые из них настолько выделяются на общем фоне, что выловить их и отбросить не составляет труда. Однако большинство грубых промахов на глаз неразличимы и поэтому могут вносить существенные искажения в результаты исследования. Для выявления и устранения грубых промахов предлагается следующая процедура.
Пусть имеется выборка объемом n, один из элементов которой X* вызвал подозрение, что он не принадлежит данной совокупности (является грубым промахом). Для всей выборки, включая X*, вычисляется среднее арифметическое
и оценка дисперсии S2, которые формируют нормированное отклонение
Затем вычисляется критерий отбраковки
где t(q,n) – критерий Стьюдента с q уровнем значимости и n = n – 2 числом степеней свободы.
Если t<tкр(5%,n), то подозреваемое число X* следует оставить в выборке; если t(5%,q)<t<tкр(0,1%,q), то число X* можно оставить или выбросить по усмотрению исследователя; если t>tкр(0,1%,n), то число X* нужно обязательно исключать из выборки.
Конечно, значения большего и меньшего уровня значимости q могут быть и другими, однако здесь приведены наиболее часто употребляемые.
|
Объём выборки, n |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
|
t (5%; n) |
12,706 |
4,3027 |
3,1824 |
2,7764 |
2,5706 |
2,4469 |
2,3646 |
2,3060 |
2,2622 |
2,2281 |
|
tкр (5%; n) |
1,4098 |
1,6454 |
1,7567 |
1,8143 |
1,8481 |
1,8698 |
1,8848 |
1,8957 |
1,9039 |
1,9103 |
|
t (0,1%; n) |
636,62 |
31,599 |
12,9240 |
8,6103 |
6,8688 |
5,9588 |
5,4079 |
5,0413 |
4,7809 |
4,5869 |
|
tкр (0,1%; n) |
1,4142 |
1,7303 |
1,9823 |
2,1781 |
2,3292 |
2,4471 |
2,5407 |
2,6163 |
2,6786 |
2,7306 |
