МОДИФИЦИРОВАННЫЙ МЕТОД СЛУЧАЙНОГО БАЛАНСА


Лабораторная  работа № 6

Цель работывыработать  навыки  обработки результатов пассивного  эксперимента для нахождения математической модели исследуемого  объекта  с  помощью  модифицированного метода случайного баланса.

1 Общие положения

1.1  Основные  предпосылки  метода

Одним из наиболее удобных методов моделирования исследуемого технологического процесса по пассивным данным является модифицированный  метод случайного баланса (ММСБ). Результатом пассивного эксперимента является таблица, каждая строка которой представляет собой числовое значение целевой функции (выходного показателя качества исследуемого объекта) при некоторых условиях (в определенный момент времени или для определенной партии изделий или при прохождении определенной технологической операции и т.п.) и числовые значения исследуемых факторов при тех  же  условиях. Такая таблица, как  правило, является результатом длительных контрольных измерений выходного показателя качества однородной продукции и сопутствующих ему факторов, например, режимов технологических   операций или параметров самого изделия на предшествующих операциях.

Как  известно, общими требованиями всех факторных планов являются некоррелированность (слабая  коррелированность) факторов, нормальность закона распределения целевой функции Y, ортогональность факторов, гомоскедастичность, т. е. равенство выборочных дисперсий во всех точках факторного пространства.

Нормальность закона распределения целевой функции проверяется обычными методами. Если она не подчиняется закону нормального распределения,  то ее следует преобразовать соответствующим образом.

Ортогональность факторов в активном эксперименте обеспечивается переносом центра координат в базовую точку эксперимента и выбором точек факторного пространства, расположенных в вершинах гиперкуба (длина каждого ребра которого принимается за удвоенную новую единицу измерения), вписанного в гиперсферу определенного радиуса. Этим обеспечивается равномерное исследование окрестностей базовой точки, в результате чего можно получить меньшую дисперсию оценок коэффициентов регрессии.

Поскольку никакого искусственного варьирования факторов (как это происходит  в  активном эксперименте, например ПФЭ) в достаточно широких пределах нет, то имеет место лишь естественное производственное  варьирование,  как правило, в пределах допуска на фактор, т.е. незначительное. Это означает, что изменение целевой функции также будет небольшим, и чтобы отличить его от шумовых флуктуаций,  необходимо иметь достаточно длинную таблицу, в которой возможный эффект воздействия конкретного параметра на целевую функцию проявился бы в достаточной мере. Опытным путем установлено, что  таблица результатов пассивного эксперимента будет достаточно длинной, если на каждый исследуемый в ней фактор приходится 10-15 строк, но не более 350 строк всего.

При пассивном эксперименте мы имеем дело с контрольно-измерительной информацией, представленной в виде таблицы, которую можно рассматривать  как таблицу координат факторов в абсолютных единицах и соответствующих  им величин целевой функции. Естественно, что все такие координаты не могут находиться в вершинах гиперкуба (т. е. быть ортогональными) или хотя бы на гиперсфере одного радиуса, однако с допустимой погрешностью можно выбрать некоторые из них, приблизительно удовлетворяющие указанному условию. Для этого достаточно перейти к новой системе координат в относительных единицах.

С этой целью и для увеличения точности результатов будущих расчетов весь  диапазон Хkmax
Xkmin каждого фактора Хk следует разбить на три части таким образом, чтобы число попаданий в каждую из них было примерно одинаковым, при этом части следует кодировать символами –1, 0 и +1. Хотя вид закона распределения факторов не оговаривается, из практики известно, что в подавляющем большинстве случаев они унимодальны (одновершинны), и для них можно оговорить правило: все значения Хk £  – 0,5Sk будут относиться к области хk = –1, все значения Хk
³  + 0,5Sk — к области xk = +1, а остальные значения     Хk — к области xk = 0 (здесь  — среднее арифметическое, Sk — среднеквадратическое отклонение числового значения фактора Хk, определенное по достаточно большому объему выборки, причем символом Хk обозначаются значения k-го фактора в абсолютных единицах, а xk — в относительных). В результате исходная таблица с контрольно-измерительной информацией превращается в план квазиактивного эксперимента. При переходе к относительным координатам толщина оболочки гиперсферы увеличивается (или, иначе, вместо точечных вершин гиперкуба появляются некоторые «вершинные» области). Поэтому требуемая точность выделения значимых факторов и определения оценок коэффициентов регрессии  может быть обеспечена только за счет увеличения числа опытов (уже  упоминавшееся  требование 10-15 строк исходной таблицы данных, приходящихся на каждый исследуемый фактор).

Наконец, последнее общее требование факторных планов — гомоскедастичность  —  в квазиактивном плане ММСБ нарушается, поэтому для расчетов оценок коэффициентов регрессии bk и их дисперсии Dk
следует использовать специальные выражения, учитывающие поправки на это нарушение гомоскедастичности (гетероскедастичность) и являющиеся в этих условиях более эффективными, чем другие оценки:

(6.1)

(6.2)

Здесь  и — подмножества элементов выходной величины из общей выборки, для которых xkj
имеет соответственно положительный или отрицательный  знак;

N1k, N2k —объем соответствующих подмножеств, причем

Nk
= N1k + N2k — общий  объем  выборки для k-го фактора;

 — оценка  математического

                                 ожидания;

— дисперсии выходной  величины  соответственно при положительных и  отрицательных  значениях фактора xk.

C помощью формул (6.1) и (6.2) можно определить значимость каждой полученной оценки коэффициента регрессии по критерию Стьюдента. При выполнении условия

                                        (6.3)

с уровнем значимости q и числом степеней свободы nk = Nk
– 2 оценки bk признаются значимыми и должны быть включены в математическую модель.

1.2 Построение плана и оценка значимости факторов

Исходную таблицу данных следует превратить в план эксперимента, заменяя числовые значения  относительным  с помощью преобразования координат. Для облегчения работы следует составить таблицу перевода факторов из одной системы измерений в другую  (таблица 6.1).Затем необходимо проверить целевую функцию на соответствие нормальному закону распределения.

Пример 1. Используя данные таблицы 1.1 найти математическую модель процента выхода годных кристаллов интегральных микросхем.

Решение. Прежде всего необходимо построить план квазиактив­ного эксперимента, для чего потребуется предварительно решить две за­дачи: определить вид закона распределения выходной величины и выбрать величину z для определения границ области .

Процент выхода годных кристаллов Y таблицы 1.1 распределен по закону, отличному от нормального, но это отличие не­велико, поэтому преобразования Y для приведения его нормальному зако­ну делать не будем. Величину z выберем равной z= 0,25. Тогда области xk
= –1 и xk
= +1 определятся из выражения .

Поскольку таблица исходных данных достаточно длинная, неизбежны совпадения некоторых строк плана, у каждой из которых, тем не менее, имеется своё значение выходной величины. Такие совпадающие строки плана следует совместить, то есть представить в конечном плане в виде одной строки с несколькими значениями выходной величины, которые необходимо рассматривать как выборку. Результат этой работы для нашего примера представлен в таблице 6.2.

Таблица 6.1 – Переход к относительным

                           координатам

Факторы

Области

xk
= –1

xk
= +1

X1

X2

X3

£ 295.2

£ 261.9

£   21.92

³ 250.0

³ 281.1

³   23.97

Экспериментальные данные, особенно полученные в условиях реального производства, как правило, содержат некоторое количество “грубых промахов”, не присущих исследуемому объекту (технологическому процессу). К сожалению, большинство этих “грубых промахов” не видны на общем фоне, однако с расслоением общей выборки на частные по строкам плана появляется возможность проверить каждую строчную выборку на однородность (отсутствие анормальных измерений) любым из известных способов.

Из плана эксперимента можно извлечь дополнительную информацию о влиянии парных взаимодействий, которые иногда могут быть больше влияния каждого фактора в отдельности. С этой целью в план эксперимента включаются столбцы парных взаимодействий, каждая координата которых и получается простым перемножением кодов координат исходных факторов.

1.3 Построение модели и проверка её адекватности

Так как число попаданий результатов эксперимента в различные строки плана неодинаково, то проверку воспроизводимости делаем по крите­рию Бартлетта (5.9).

Полученное неравенство свидетельствует о том, что все строчные дис­персии однородны и имеют лишь случайное отклонение от средневзвешен­ной дисперсии опыта  с  числом степеней свободы. В свою очередь доказанная однородность строчных дисперсий означает, что резуль­таты опытов правильно отражают реальную картину исследуемого объек­та, могут быть повторно воспроизведены при новых измерениях и их можно использовать для дальнейших расчетов.

Таблица 6.2 – План ММСБ, результаты эксперимента и их частичная обработка

j

1

_——

59.0;56.7;57.0;57.0;47.1;60.4;58.6;57.9;56.0;56.8;57.7;55.8

12

56.67 10.788 54.65 48.4812

2

0 54.9;59.4;52.4;59.6;58.7;54.0;59.0

7

56.86 8.973 56.43 1.2943

3

+ 59.1;51.0;55.3;60.4;57.5;55.2;55.6;50.4;53.1

9

55.29 11.591 58.21 7607376

4

60.5;58.2;56.2;58.7;59.8;59.7

6

58.85 2.363 56.82 24.7254

5

0 0 63.0;61.5;55.8

3

59.83 18.083 58.60 4.5387

6

0 + 61.5;62.1;64.0

3

62.53 1.703 60.37 13.9968

7

+ 58.6;65.4;60.5;66.0;62.4;62.8;56.6;54.7;55.2;62.3;57.3;59.7;

57.7;59.5;56.6;55.2;52.5;57.6;65.1

19

59.25 15.207 58.99 1.2844

8

+ 0 59.4;58.0;55.6

3

57.67 3.693 60.76 28.6443

9

+ + 61.9;67.5;63.7;63.4;65.0;63.8;65.5;60.8;71.7;61.2;67.9;68.2;

63.0;62.7;66.5;63.4;64.0;65.2;64.5;60.8

20

64.54 7.691 62.54 80.0000

10

0 59.5;60.9;55.2;58.2;51.8;58.1

6

57.28 10.782 57.86 0.8664

11

0 0 56.0;60.2;62.7;54.8

4

58.45 13.323 59.63 5.5696

12

0 + 64.2;59.4;64.4;61.0;58.3;58.9;54.6

7

60.11 11.921 61.41 11.8300

13

0 0 63.6;65.3

2

64.45 62.30 9.2450

14

0 0 0 64.4;65.1

2

64.75 64.07 0.9248

15

0 0 + 66.0

1

66.0 65.85 0.0225

16

0 + 66.7

1

66.7 66.74 0

17

0 + 0

18

0 + + 69.3;77.2;70.8

3

72.43 17.603 70.29 13.7388

10

+ 55.1;67.4;61.9;61.7;65.1;57.2;60.0;53.9;69.8

9

61.34 29.513 61.10 0.5184

20

+ 0 60.2;66.3

2

63.25 62.83 0.3528

21

+ + 70.0;61.1;62.8;64.6;69.5;65.5;64.9;64.769.7

9

65.87 10.143 64.61 14.2884

22

+ 0 69.8;66.1;64.9;69.0;65.2;66.5;67.1

7

66.94 3.423 67.77 4.8223

23

+ 0 0 68.2;69.4;70.1;67.4

4

68.78 1.456 69.55 2.3716

24

+ 0 + 69.9;64.0;73.5

3

69.13 23.003 71.32 14.3883

25

+ + 75.0;72.9;71.7;79.580.9;79.0;75.0;76.2;69.5

9

75.52 14.449 74.49 9.5481

26

+ + 0 75.2;74.9;78.3;72.7;76.5;68.6

6

74.37 11.407 76.26 21.4326

27

+ + + 72.3;71.3;73.5;75.7;78.7;77.3;82.0;72.2;78.9;74.0;77.6;78.3;

82.3;73.6;79.7;82.1;78.0

12

76.91 13.001 78.04 21.7073

Для нахождения оценок коэффициентов, их дисперсий и определения их значимости воспользуемся формулами (6.1), (6.2) и (6.3). Результа­ты расчетов представлены в таблице 6.3.

Таблица 6.3 – Результаты расчётов оценок коэффициентов регрессии

Параметр

оценки

Факторы и взаимодействия

66

70,54

45,565

82

59,59

19,638

64,47

5,48

0,405

8,602

1,982

78

68,04

65,224

65

59,16

23,810

64,00

4,44

0,301

8,098

1,982

72

66,50

59,132

71

61,95

48,065

64,24

1,78

0,375

2,900

1,982

60

66,82

110,662

62

62,27

20,146

64,51

2,28

0,542

3,089

1,982

66

64,64

75,233

57

64,50

46,688

64,57

0,07

0,490

0,100

1,982

67

65,54

70,780

54

62,65

56,380

64,25

1,45

0,529

1,994

1,982

Следует подчеркнуть, что  величины  для каждого k-го фактора будут своими и, в силу этого, оценку  следует искать как среднее арифметическое всех значений выходной величины Y,полученных экспериментальным путём, кроме выявленных грубых промахов.

Поскольку значимыми факторами следует признать ,,  и  , а величина =64,07, то искомая модель может быть представлена в виде

Что касается члена при парном взаимодействии , то, хотя формально он должен быть включён в модель, однако расхождение между расчётным и табличным критериями Стьюдента столь незначительно, что можно попытаться не включать его  (из того соображения, что чем короче модель, тем удобнее работать с ней). Окончательно этот вопрос решается на стадии  проверки адекватности модели, которая, в силу  отклонения выходной величины Y от нормального закона, должно проводиться по критерию К.Пирсона (1.13)

 .

Таким образом, найденная модель правильно отражает экспериментальные данные и может быть использована для анализа работы и для оптимизации  исследуемого объекта.

Любопытно отметить что, в данном случае критерий  Фишера также подтвердил правильность нахождения модели:

и                          

Если считать только по  средним арифметическим строк плана, то

    и  

         После отсеивания незначимых факторов, очистки данных от грубых ошибок и определения веса каждого значимого фактора с помощью ММСБ, массив информации становится пригодным для моделирования другими, более точными методами, например методом наименьших квадратов с предварительной ортогонализацией факторов.

2  Порядок проведения работы

2.1.  По исходной таблице данных определить схему перехода к кодированным  (ортогональным) значениям факторов.

2.2. Проверить закон распределения выходной величины. В случае несоответствия  его нормальному закону подобрать необходимое преобразование.

2.3.  Построить свернутый план эксперимента аналогично таблице 6.2.

2.4.  Проверить каждую строку плана на отсутствие анормальных наблюдений («грубых промахов»).

2.5.  Определить оценки коэффициентов модели для каждого фактора и их парных взаимодействий и проверить их значимость.

2.6.  Если среди факторов обнаружится хотя бы один незначимый, убрать из плана соответствующий столбец, совпадающие строки совместить и повторить работу, начиная с п.2.4.

2.7.  Для каждой строки окончательного плана подсчитать число попаданий, среднее арифметическое и выборочную дисперсию, а также оценку математического ожидания всех значений выходной величины, попавших в окончательный план.

2.8. Написать уравнение регрессии (математическую модель) исследуемого объекта.

2.9. Проверить воспроизводимость опытов и определить средневзвешенную дисперсию.

2.10.  Определить дисперсию неадекватности и доказать адекватность найденной модели.

2.11. Написать модель по обратному преобразованию выходной величины (если необходимо).

3  Содержание отчёта

Отчет о лабораторной работе должен содержать таблицу преобразования  факторов из абсолютных единиц в условные коды, свернутый планэксперимента, таблицу расчета элементов оценок коэффициентов регрессии, все расчеты по пп. 2.1.-2.11.

При подготовке к защите лабораторной работы необходимо ознакомиться с контрольными вопросами и продумать ответы на них.

4  Контрольные вопросы

4.1 Как доказать нормальность распределения случайной величины?

4.2 Какой эксперимент можно назвать активным, пассивным?

4.3 Каковы общие требования всех факторных планов эксперимента?

4.4 Почему число степеней свободы в формуле (6.3) равно N –2?

4.5 Чем можно объяснить деление диапазона варьирования фактора именно на три области?

4.6 Почему при вычислении оценок модели по пассивным данным требуется поправка на гетероскедастичность?

4.7 Для чего нужна длинная таблица экспериментальных данных? Каков критерий этой длины?

4.8 Почему необходимо проверять именно строчные выборки плана на отсутствие анормальных наблюдений («грубых промахов»)?

4.9 Почему следует учитывать влияние парных взаимодействий, а остальными можно пренебречь?

4.10 Чем вызвана необходимость использования для проверки воспроизводимости критерий Бартлетта, а не критерий Кохрена?

4.11 Почему при подсчете дисперсии неадекватности используется общее  число измерений, а не число строк плана? При каких условиях можно использовать число строк плана?

5  Рекомендуемая литература

5.1 Долгов Ю.А. Статистическое моделирование: Учеб. для вузов.- Тирасполь: РИО ПГУ, 2002. – 280с.(С. 143 – 152; 174 – 183.)

5.2 Долгов Ю.А., Борщевич В.И., Сорокин Г.Ф. Информационный подход к моделированию технологических процессов. — Кишинев: Штиинца, 1984. — 172 с. (С. 114-133).

5.3 Долгов Ю.А., Шестакова Т.В. Методы обработки результатов пассивного эксперимента: Учеб. пособие. — Кишинев: Изд-во КПИ им. С.Лазо, 1989. — 32 с. (С. 14-23).

5.4 Львовский Е.Н. Статистические методы построения эмпирических формул: Учеб. пособие для втузов. — 2-е изд., перераб. и доп. — М.: Высш. шк., 1988. — 239 с. (С. 17-26).

5.5 Статистические методы обработки эмпирических данных: Рекомендации. — М.: Изд-во стандартов, 1978. — 232 с. (С. 17-19).

5.6 Ликеш И., Ляга Й. Основные таблицы математической статистики/ Пер. с чешск. — М.: Финансы и статистика, 1985. — 356 с. (С. 35-36, 182-186).

5.7 Джонсон Н., Лион Ф. Статистика и планирование эксперимента в технике и науке. Методы обработки данных / Пер. с англ. — М.: Мир, 1980. — 610 с. (С. 162-168).

Загрузка...