Расчет параметров выборки


Расчет параметров выборки при наличии свертки в виде гистограммы (или соответствующей ей таблицы разрядов и частот) удобнее всего вести через некоторые вспомогательные параметры, которые называются моментами.

Существуют три вида моментов ряда распределения.

1. Простые или начальные моменты представляют собой сумму отклонения средних значений разрядов гистограммы от некоторой произвольной точки Xа взятой в h-ой степени и умножения на соответствующую относительную частоту

clip_image002. (1.9)

Если Xа = 0 и при этом h = 1, то

clip_image004 (1.10)

является средним арифметическим выборки.

2. Центральные моменты, которые отличаются от начальных только обязательным равенством Xа =clip_image006, то есть

clip_image008. (1.11)

Первый центральный момент m1= 0. Второй центральный момент m2 называется эмпирической (выборочной) дисперсией распределения и часто обозначается S2. Отсюда можно вычислить среднеквадратическое отклонение S = clip_image010 .

3. Основные моменты представляют собой отношение центральных моментов к среднеквадратичному отклонению в соответствующей степени

clip_image012. (1.12)

В частности clip_image014и т.д.

Третий основной момент служит мерой косости (асимметрией) кривой распределения относительно центра

clip_image016. (1.13)

Кривая распределения может обладать положительной (clip_image018>0) и отрицательной (clip_image018[1]<0) косостью (асимметрией) и косостью, равной нулю (clip_image018[2]=0). В последнем случае говорят, что кривая распределения симметрична.

Выражениеclip_image020

clip_image022 (1.14)

служит мерой крутости (эксцессом) выборочного распределения относительно кривой нормального распределения. Пределами существования меры крутости является -2 < clip_image024< + clip_image026 . При clip_image024[1]>0 кривая распределения более круто уходит вверх, чем нормальное распределение, и является островершинной. При clip_image024[2] < 0 кривая является плосковершинной, переходящей в двувершинную (т.е. может быть вдавлена в середине). Равенство clip_image027= -2 указывает, что двувершинная кривая распределения распадается на две отдельные кривые. Вообще двувершинность указывает на неоднородность ряда распределения, т.е. ряд представляет собой результат наложения каких-то двух однородных и, следовательно, одновершинных рядов.

При различного рода статистических вычислениях в силу конечности числа опытов большое значение имеют основные ошибки вычисления всех параметров ряда распределения. Их можно найти по следующим приближённым формулам:

clip_image029; clip_image031; clip_image033; clip_image035. (1.15)

Точность вычислений можно охарактеризовать с помощью обобщающего параметра, который называется показателем точности исследования

clip_image037. (1.16)

Чем точнее проведено исследование, тем меньше показатель e.

Проиллюстрируем сказанное на примере. В табл. 1.1 представлены результаты контрольных измерений параметров одного типа электрорадиоэлементов после некоторой технологической операции, причем три параметра считаются первоначальными факторами (X1, X2, X3), а один — выходным показателем качества (Y). Построим гистограмму и определим ее параметры для первого фактора X1.

Таблица 1.1

Таблица экспериментальных данных

X1 X2 X3 Y

X1 X2 X3 Y

X1 X2 X3 Y

X1 X2 X3 Y

245, 256, 29,4 64,2

274, 268, 22,5 68,2

318, 282, 21,2 75,0

232, 315, 24,5 69,3

243, 198, 23,5 56,1

153, 330, 25,2 61,9

251, 320, 25,9 72,3

197, 234, 22,0 54,9

217, 244, 27,4 59,1

223, 246, 18,6 59,0

274, 279, 25,0 69,9

193, 257, 18,0 56,7

145, 315, 21,7 58,6

225, 293, 21,7 65,4

319, 234, 27,2 70,0

215, 266, 26,8 61,5

299, 286, 18,5 72,9

192, 287, 19,8 60,5

207, 242, 21,5 57,0

255, 182, 20,2 55,1

277, 260, 21,0 67,4

209, 314, 20,9 66,0

222, 275, 22,8 63,0

176, 317, 20,7 62,4

213, 273, 26,4 62,1

255, 221, 22,4 60,2

283, 293, 17,2 71,7

206, 324, 26,3 67,5

252, 223, 30,5 61,1

294, 263, 21,0 69,8

241, 265, 19,9 63,6

221, 263, 16,0 60,5

186, 312, 26,6 63,7

222, 276, 29,8 64,0

241, 280, 24,2 66,0

261, 303, 24,8 71,3

341, 301, 17,6 79,5

260, 266, 21,1 66,1

214, 286, 18,8 62,8

195, 302, 25,6 63,4

201, 248, 21,3 57,0

270, 281, 23,4 69,4

301, 299, 22,1 75,2

172, 337, 25,2 65,0

249, 271, 20,4 65,3

151, 282, 17,5 54,7

238, 229, 24,2 59,4

300, 245, 32,8 47,1

212, 157, 21,4 47,1

193, 304, 28,0 63,8

195, 202, 24,7 51,0

219, 260, 20,0 60,4

258, 247, 27,4 64,4

230, 248, 25,8 61,0

144, 288, 21,9 55,2

172, 341, 24,7 65,5

220, 246, 18,4 58,6

278, 215, 27,5 62,8

208, 284, 21,6 62,3

204, 280, 23,0 61,5

273, 231, 30,8 64,6

180, 286, 23,3 59,4

199, 233, 24,4 55,3

289, 309, 22,0 74,9

256, 263, 18,2 64,9

164, 289, 18,9 57,3

158, 317, 24,7 60,8

251, 253, 24,9 64,0

172, 299, 20,3 59,7

254, 239, 19,3 61,9

210, 356, 24,6 71,7

229, 254, 20,1 60,9

196, 264, 20,5 58,2

294, 286, 28,4 73,5

288, 254, 33,2 69,5

292, 268, 12,3 69,0

242, 267, 22,9 64,4

278, 240, 24,3 65,5

319, 284, 24,5 75,7

324, 311, 23,2 78,3

278, 229, 30,7 64,9

160, 295, 22,2 58,0

260, 262, 17,4 65,2

167, 278, 18,3 56,2

293, 286, 22,6 72,7

215, 242, 21,1 57,9

270, 224, 17,8 61,7

328, 299, 24,6 78,7

199, 311, 26,8 65,2

282, 335, 27,5 78,0

255, 178, 14,6 53,9

207, 268, 18,2 59,7

211, 254, 22,0 59,0

235, 299, 17,3 66,7

324, 331, 25,9 82,1

312, 273, 24,3 73,5

243, 223, 15,8 58,1

236, 278, 23,5 65,1

228, 181, 20,0 51,8

272, 260, 23,4 28,2

309, 251, 18,7 69,8

194, 240, 24,9 55,6

169, 304, 27,1 60,8

197, 275, 21,2 59,8

194, 198, 24,4 50,4

245, 251, 22,8 62,7

190, 316, 25,4 64,5

256, 278, 22,9 67,4

230, 198, 24,0 54,6

258, 325, 24,9 73,6

202, 229, 24,6 55,2

289, 336, 33,2 79,7

203, 259, 22,4 58,7

146, 307, 20,1 57,6

343, 313, 25,9 82,3

262, 296, 17,1 69,5

181, 242, 22,0 54,0

218, 302, 17,7 65,1

195, 268, 20,9 58,7

190, 223, 25,6 53,1

157, 291, 17,6 56,6

330, 316, 24,0 80,9

238, 236, 23,7 60,2

226, 213, 17,9 55,2

336, 301, 17,7 79,0

241, 222, 19,1 58,2

129, 282, 20,0 52,5

165, 333, 27,9 64,0

228, 202, 23,9 54,8

228, 244, 19,8 59,5

211, 261, 26,3 60,4

214, 281, 27,5 63,4

209, 237, 16,9 56,0

299, 311, 23,2 76,5

195, 285, 24,1 61,2

299, 316, 24,1 77,3

152, 304, 18,4 57,7

300, 302, 19,3 75,0

248, 364, 24,8 77,2

238, 219, 25,3 58,3

292, 267, 22,0 70,1

238, 322, 24,0 70,8

343, 309, 24,5 82,0

274, 248, 17,4 65,1

265, 309, 26,3 72,2

309, 303, 19,2 76,2

263, 194, 17,4 57,2

323, 298, 32,1 78,9

205, 319, 34,8 67,9

215, 253, 22,6 59,4

286, 300, 25,8 74,0

177, 294, 19,1 59,5

216, 195, 22,6 52,4

253, 225, 19,0 60,0

175, 262, 22,8 55,8

203, 324, 34,0 68,2

157, 288, 20,4 56,6

203, 292, 24,1 63,0

258, 272, 20,2 66,5

142, 292, 22,9 55,6

202, 251, 16,6 56,8

205, 281, 30,6 62,7

265, 260, 23,4 66,3

273, 230, 32,3 64,7

205, 255, 16,8 57,7

340, 207, 31,6 69,7

188, 253, 19,6 55,8

215, 255, 22,2 59,6

185, 337, 25,4 66,5

149, 288, 17,1 55,2

338, 281, 24,7 77,6

228, 228, 29,3 58,9

300, 323, 24,4 78,3

205, 243, 26,7 57,5

255, 279, 21,2 67,1

252, 292, 22,5 68,6

Так как Xmin = 129, a Xmax = 341, то по формуле (1,7) количество разрядов определилось k = 9, шаг C=24,0, a начало гистограммы следует сместить до X?min = 128. Саму гистограмму сравнительно легко построить вручную (или написать программу для компьютера) путем просмотра таблицы исходных данных и откладывания каждого числа в виде прямоугольника с основанием, равным ширине соответствующего разряда. После просмотра всех чисел будем иметь гистограмму (рис,1,1), а, соединив середины плоских вершин каждого разряда гистограммы прямыми линиями, получим экспериментальный график (полигон) функции плотности вероятности или дифференциального закона распределения. Числовые характеристики распределения, подсчитанные по формулам (1,9) – (1,16), равны:

clip_image039; e = 1,56%;

clip_image0412 = 2469,3; S clip_image043;

clip_image045; clip_image047;

clip_image049; clip_image051.

clip_image052

Рис.1.1. Гистограмма и полигон (эмпирическая плотность вероятности)

выборочного распределения

Полученные результаты позволяют перейти к следующему этапу исследования — определению вида закона распределения, другими словами, к поиску той теоретической кривой, с которой больше всего согласуются исходные экспериментальные данные.