Большинство исследовательских задач, решаемых с помощью математической статистики, сводится к нахождению оценок параметров выборочных распределений, а по ним – к определению параметров генеральных совокупностей. При этом всякому решению, принимаемому при статистической оценке параметров, необходимо ставить в соответствие вероятность, характеризующую степень достоверности принимаемого решения (доверительную вероятность).
В предыдущих разделах были показаны два способа получения оценок параметров выборки – прямой и с помощью моментов. Другие способы, описанные в теоретической литературе (например, метод максимального правдоподобия), в прикладных задачах требуются весьма редко и в данной книге не используются. Однако для понимания дальнейшего материала приведем некоторые выводы теории оценивания.
Обозначим через qn оценку генерального параметра q, полученную из выборки объема n (qn есть обобщенный символ любой выборочной оценки – среднего арифметического, эмпирической дисперсии, СКО и т.п.). Основными свойствами оценок должны быть:
1) несмещенность: М[qn] = q, т.е. математическое ожидание оценки параметра равно самому параметру генеральной совокупности;
2) эффективность: D[qn] = min, т.е. дисперсия оценки должна быть минимальной;
3) состоятельность: P {?qn — q ?< e } > 1 – q, т.е. при неограниченном возрастании объема выборки оценка qn стремится к параметру q с вероятностью 1.
Теоретическими трудами доказано, что для нормального распределения имеют место равенства
Другими словами, случайная величина – среднее арифметическое – распределена нормально с математическим ожиданием, совпадающим с математическим ожиданием исходной генеральной совокупности, и с дисперсией, которая в n раз меньше дисперсии генеральной совокупности, где n – объем выборки.
Большую помощь в решении статистических задач оценивания оказывают статистические гипотезы.
Под статистическими гипотезами понимаются некоторые предположения относительно характера распределения вероятностей генеральных совокупностей и их параметров.
Проверка гипотезы заключается в сопоставлении некоторых статистических показателей (критериев проверки), вычисленных по данным выборки, со значением этих показателей, определенных теоретически в предположении, что гипотеза верна. Как правило, одновременно проверяются две гипотезы – нулевая (обозначается H0) и альтернативная (обозначается H1). Нулевая гипотеза заключается в утверждении равенства чего-то чему-то, например, запись H0:
= M[X] означает нулевую гипотезу, состоящую в утверждении равенства выборочного среднего арифметического математическому ожиданию генеральной совокупности. Альтернативная гипотеза, напротив, заключается в утверждении неравенства этих же величин, чему соответствует запись H1: ![]()
M[X].
При проверке гипотезы предварительно задаются некоторым уровнем значимости q (к сожалению, выбор уровня значимости всегда произволен, и от этого произвола зависит принятие гипотезы; обычно q =1,2 или 5%), т.е. степенью риска, при котором может быть принята неправильная гипотеза. Тогда вероятность попадания критерия проверки в область допустимых значений (доверительная вероятность) равна Pдов=(1–q)?100. Если значения критерия, вычисленные по данным выборки, окажутся в критической области, то нулевая гипотеза H0 бракуется и принимается альтернативная гипотеза H1. При значениях критерия, принадлежащих области допустимых значений, ничего нельзя утверждать категорически, а можно лишь сделать заключение, что данные выборки не противоречат нулевой гипотезе H0.
