Загрузка...

Сравнение центров двух выборочных распределений


Одна из наиболее часто встречающихся задач статистической проверки гипотез заключается в сравнении центров распределений двух нормально распределенных величин X1 и X2, т.е.

H0: clip_image0021 = clip_image002[1]2;

H1: clip_image002[2]1 clip_image006 clip_image002[3]2;

Здесь возможны принципиально четыре различных ситуации относительно дисперсий генеральных совокупностей clip_image009 и clip_image011

1) обе дисперсии известны и равны между собой;

2) обе дисперсии известны, но неравны между собой;

3) обе дисперсии неизвестны, но предполагается, что они равны между собой;

4) обе дисперсии неизвестны, их равенство не предполагается.

На практике в подавляющем большинстве случаев имеет место третья ситуация, которую и рассмотрим.

Для решения задачи предварительно определяются оценки математического ожидания (средние арифметические) clip_image013 и clip_image015, а также эмпирические дисперсии clip_image017 и clip_image019. В качестве критерия берется t-распределение Стьюдента

t = clip_image021, (1.27)

где S2 = clip_image023 — средневзвешенная дисперсия с числом степеней свободы n= n1+n2–2, a n1 и n2 – соответствующие объемы выборок.

По таблице критических значений (табл.П.2. Приложения) для выборочного уровня значимости q находим tтабл,(q,n). Если t < tтабл,, то гипотеза H0 о равенстве центров распределения принимается, если нет – отвергается и принимается альтернативная гипотеза H1.

Следует отметить, что распределение Стьюдента не зависит от математического ожидания и дисперсии генеральной совокупности, зависит только от объема выборки и является аналогом нормального распределения для выборок малого объема (n < 30 – 40), при больших объемах оно практически полностью совпадает с нормальным распределением.

С помощью критерия Стьюдента можно решать задачи не только о равенстве (неравенстве) центров распределения двух выборок, но и о равенстве (неравенстве) центра распределения выборки некоторому неслучайному числу – константе (в том числе и нулю), а также о доверительных границах и интервалах. Кроме того, на основе критерия Стьюдента можно построить простой, но очень эффективный способ отсеивания так называемых грубых промахов.

При экспериментальных измерениях, особенно в цеховых или полевых условиях, нередко в массив данных вкрапливаются так называемые “грубые промахи”, которые являются результатом усталости персонала, сбоя оборудования, неполадок в технологическом процессе и т.п. Некоторые из них настолько выделяются на общем фоне, что выловить их и отбросить не составляет труда. Однако большинство грубых промахов на глаз неразличимы и поэтому могут вносить существенные искажения в результаты исследования. Для выявления и устранения грубых промахов предлагается следующая процедура.

Пусть имеется выборка объемом n, один из элементов которой X* вызвал подозрение, что он не принадлежит данной совокупности (является грубым промахом). Для всей выборки, включая X*, вычисляется среднее арифметическое clip_image025 и оценка дисперсии S2, которые формируют нормированное отклонение

clip_image027.

Затем вычисляется критерий отбраковки

clip_image029, (1.28)

где t(q,n) – критерий Стьюдента с q уровнем значимости и n = n – 2 числом степеней свободы.

Если t<tкр(5%,n), то подозреваемое число X* следует оставить в выборке; если t(5%,q)<t<tкр(0,1%,q), то число X* можно оставить или выбросить по усмотрению исследователя; если t>tкр(0,1%,n), то число X* нужно обязательно исключать из выборки.

Конечно, значения большего и меньшего уровня значимости q могут быть и другими, однако здесь приведены наиболее часто употребляемые.

Объём выборки, n

3

4

5

6

7

8

9

10

11

12

t (5%; n)

12,706

4,3027

3,1824

2,7764

2,5706

2,4469

2,3646

2,3060

2,2622

2,2281

tкр (5%; n)

1,4098

1,6454

1,7567

1,8143

1,8481

1,8698

1,8848

1,8957

1,9039

1,9103

t (0,1%; n)

636,62

31,599

12,9240

8,6103

6,8688

5,9588

5,4079

5,0413

4,7809

4,5869

tкр (0,1%; n)

1,4142

1,7303

1,9823

2,1781

2,3292

2,4471

2,5407

2,6163

2,6786

2,7306

Загрузка...