ПОЛНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ.


Лабораторная работа 2.

Цель  работы — выработать навыки построения плана, проведения эксперимента  и  обработки  полученных результатов для нахождения математической  модели  исследуемого  объекта  методом полного факторного эксперимента.

1  ОБЩИЕ  ПОЛОЖЕНИЯ

1.1 Основные  предпосылки  нахождения  математической  модели

Одним из основных методов изучения сложных процессов и отражения связей  между параметрами объекта является математическое моделирование. Модель — это упрощенная система, отражающая отдельные стороны явлений изучаемого объекта. Каждый изучаемый процесс можно описать различными  моделями, при этом ни одна модель не может сделать это абсолютно полно и всесторонне. Однако использование упрощенной модели, отражающей отдельные черты исследуемого объекта, позволяет яснее увидеть взаимосвязь причин и следствий, входов и выходов, быстрее сделать необходимые выводы, принять правильные решения.

Различают физическое и математическое моделирование. При физическом  моделировании исследование объекта происходит при его воспроизведении  в  ином  масштабе. Здесь возможен количественный перенос результатов эксперимента с модели на оригинал. Однако для анализа сложных объектов и процессов, каковыми являются большинство электронных схем, конструкций и технологических процессов производства радиоэлектронной техники, приборостроения, машиностроения и других промышленных отраслей, применение физического моделирования затруднительно, поскольку приходится использовать большое число критериев и ограничений, которые могут быть несовместимы, а зачастую и невыполнимы.

Математическое моделирование является методом качественного или количественного описания объектов или процессов, при этом реальный объект, процесс или явление упрощается, схематизируется и описывается определенным уравнением.

Описание исследуемого объекта нельзя получить в виде точной формулы  функции, справедливой во всем диапазоне существования аргументов. Оно может быть лишь приближенным и на небольшом участке в окрестностях выбранной базовой точки. Аппроксимация искомой математической зависимости представляет собой некоторый полином — отрезок  ряда Тейлора, в который разлагается неизвестная зависимость:

              (2.1)

где

В силу наличия неуправляемых и даже неконтролируемых входных переменных Xi изменение величины Y носит случайный характер, а потому уравнение (2.1) не дает нам точной связи между входом и выходом объекта и является лишь условным математическим ожиданием случайной величины Y, т.е. уравнением регрессии.

Чтобы отыскать коэффициенты уравнения регрессии по результатам экспериментов в N точках факторного пространства (что является типичной задачей регрессионного анализа), необходимо выполнение следующих предпосылок:

1. Результаты наблюдений Y1, Y2, … , YN выходной величины в N
точках  факторного пространства представляют собой независимые, нормально распределенные случайные величины.

2. Выборочные дисперсии опытов  однородны, т.е. статистически неразличимы. Это требование означает независимость выборочной дисперсии от местоположения точки факторного пространства, в которой проводится конкретный опыт (ротатабельность).

3. Независимые переменные X1, X2, … , XN
измеряются с ошибкой много меньшей, чем величина возможного отклонения выходного параметра Y под влиянием неучтенных факторов.

Тогда задача отыскания коэффициентов уравнения регрессии сводится к решению системы так называемых нормальных уравнений:

                                (2.2)

где      Yg— экспериментальные значения выходного параметра, полученные в g-й точке факторного пространства;

— значение выходного параметра, найденные по уравнению регрессии в тех же точках;

d — количество членов в уравнении регрессии.

Выражение (2.2) является основным критерием проверки правильности найденного уравнения регрессии.

Чтобы система нормальных уравнений, которая может быть представлена в виде матрицы, имела единственное решение, необходимо, чтобы матрица была невырожденной, т.е. чтобы вектор-столбцы были линейно независимы.  Чтобы величины коэффициентов уравнения регрессии  не зависели от числа членов матрицы, нужно на нее наложить дополнительное условие ортогональности вектор-столбцов.

Таким образом, для получения независимых друг от друга оценок коэффициентов регрессии эксперимент следует спланировать так, чтобы выполнялись условия линейной независимости и ортогональности вектор-столбцов матрицы независимых переменных (матрицы планирования).

1.2 Планирование  полного  факторного  эксперимента

Полным факторным экспериментом (ПФЭ) называется эксперимент, реализующий все возможные неповторяющиеся комбинации независимых переменных, каждая из которых принудительно варьируется на двух уровнях. Число этих комбинаций N = 2n определяет тип планирования.

Для гарантированного получения единственного решения системы нормальных уравнений необходимо иметь ортогональную матрицу планирования, что невозможно обеспечить в абсолютной системе единиц факторов Xi, то есть тогда, когда факторы представлены в именованной форме. Поэтому необходимо провести предварительное преобразование каждого фактора — его перевод в систему относительных координат. Такое преобразование легко сделать с помощью переноса начала координат в базовую точку Х* и выбора                         единицы отсчёта DХi по каждой координате Хi.

Рисунок 2.1 – Схема перехода в относительные координаты

                                                         (2.3)

Это дает возможность легко построить ортогональную матрицу планирования и значительно облегчает дальнейшие расчеты, так как в этом случае верхние и нижние уровни варьирования XiВ и XiН в относительных единицах будут равны соответственно хiВ
= +1 и хiH = – 1.

Шаг варьирования по каждой переменной выбирается таким, чтобы приращение величины выходного параметра Y к базовому значению Y* при реализации шага можно было выделить на фоне «шума» при небольшом числе параллельных опытов. Если нет никаких указаний на величину шага DXi, то в первом приближении можно выбрать DXi = 0,15, т.е. принять за шаг 15%-ное отклонение от базового уровня . Такой шаг дает достаточную гарантию того, что фактор Xi вызовет заметную реакцию Y, если связь между ними существует.

Матрицу  планирования  полного факторного эксперимента можно представить  в виде таблицы 2.1 на примере ПФЭ типа 23 , т.е. для случая трехфакторной задачи. В таблице представлены не только относительные  переменные Xi, но и их парные и тройные взаимодействия. Для удобства расчетов и представления формул каждый столбец может быть представлен в виде новой переменной Zig.

Матрица планирования составляется по следующим правилам:

1) каждая g-я строка матрицы представляет собой набор координат точки  , в которой производится эксперимент;

2) вводится фиктивная переменная Z0g = х0  = +1;

3) поскольку переменные Z1g = х1g, Z2g = х2g и Z3g = х3g
принимают лишь значения +1 и –1, то  все остальные переменные Zig могут принимать те же значения, что позволяет в целях упрощения записывать в таблицу вместо +1 и –1  их знаки «плюс» и «минус»;

4)  первая строка  выбирается так, чтобы управляемые переменные находились на нижнем уровне, т.е. Z1 = х11 = –1, Z21 = х21 = –1, Z31 = х31 = –1. Последующие строки при составлении матрицы планирования набираются по правилу: при построчном переборе всех вариантов частота смены знака управляемых переменных  для каждой последующей переменной вдвое меньше, чем для предыдущей (см. таблицу 2.1).

Эти столбцы управляемых переменных и образуют собственно план  эксперимента, а остальные элементы матрицы получаются перемножением соответствующих управляемых переменных. Матрицы планирования 24, 25 или любого другого числа независимых переменных могут быть получены описанным выше способом.

Таблица 2.1 — Матрица планирования эксперимента и обработка его результатов

Номер

стро-ки,

g

Порядок реализации,

l

Матрица

планирования

эксперимента

Результаты

эксперимента

и проверка

воспроизводимости

Проверка

адекватности

Z0

Z1

Z2

Z3

Z4

Z5

Z6

Z7

Yig

Yig

Yig

k1

k2

k3

x0

x1

х2

х3

x1x2

х1х3

х2х3

х1х2х3

1

2

3

4

5

6

7

8

1

7

3

8

6

4

2

5

6

5

7

2

3

4

1

8

8

4

6

7

2

1

5

3

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

Легко заметить, что матрица планирования является ортогональной с линейно независимыми вектор-столбцами; отсюда следует диагональность  матрицы  нормальной системы уравнений, а следовательно, и взаимная независимость оценок коэффициентов уравнения регрессии.

Необходимо  отметить,  что  получаемая модель не дает членов типа  и,  таким образом, является неполной. В большинстве случаев это не отражается на качестве модели, так как чаще всего bii
= 0. Однако в случаях, когда bii ¹ 0, модель становится неточной (неадекватной), тогда следует от ПФЭ переходить к другим принципам планирования (как правило, это случается в окрестностях частного или глобального экстремума целевой функции).

1.3 Проведение  эксперимента  и  проверка  воспроизводимости

Поскольку изменение выходной величины Y носит случайный характер, необходимо в каждой точке (т.е. в точке с координатами, записанными в g-й строке) проводить m параллельных опытов и результаты наблюдений Y1g, Y2g,…,Ymg
усреднять

                                                         (2.4)

Величина m может быть любой, но не меньше m = 3. Тогда эксперимент делится на m серий опытов, в каждой из которых полностью реализуется матрица планирования (т.е. эксперимент проводится в N = 2n точках факторного пространства).

Одним из важнейших положений современной теории планирования эксперимента является рандомизация. План эксперимента составляется так, чтобы рандомизировать, т.е. сделать случайными те систематически действующие  факторы, которые трудно поддаются учету и контролю, для того чтобы рассматривать их как случайные величины и учитывать статистически.

Перед реализацией плана на объекте необходимо произвести рандомизацию — с помощью таблицы равномерно распределенных случайных чисел (таблица А.7) определить последовательность реализации матрицы планирования в каждой из m серий опытов. Для этого в качестве первого выбирается любое число из таблицы А.7 и записывается в столбец k1 таблицы 2.1 на место g = 1. Остальные места этого столбца заполняют числа от 1 до N, следующие по порядку из таблицы А.7 за выбранным первоначальным. Следует обращать внимание на то, чтобы числа в столбцах таблицы 2.1 не повторялись дважды. Пусть, например, при g = 4 k14 = 8, это значит, что в первой серии испытаний точка  реализуется восьмой по порядку.

Аналогично рандомизируются испытания в каждой из оставшихся серий экспериментов; порядок реализации записывается в столбцах k2, k3,…, km. Результаты эксперимента в каждой из серий испытаний записываются в столбцах Y1, Y2,…,Ym.

Проверка воспроизводимости — это проверка на выполнения второй предпосылки регрессионного анализа об однородности выборочных дисперсий . Задача состоит в проверке гипотезы о равенстве дисперсий  s2{Y1} = s2{Y2} = … = s2{YN} при  экспериментах соответственно в точках ,,…,,…,.

Оценки дисперсий находятся по формуле

                                              (2.5)

Так как все дисперсии получены по выборкам одинакового объема m, то число степеней свободы для всех дисперсий одинаково и равно

n1 = m – 1.                                                                 (2.6)

Для  проверки гипотезы об однородности оценок дисперсий следует пользоваться  критерием  Кохрена, который основан на законе распределения отношения максимальной эмпирической дисперсии к сумме всех дисперсий, т.е.

                                                          (2.7)

Если расчетное значение критерия окажется меньше табличного значения  , найденного для q%-го уровня значимости, nчисл = n1 — числа степеней свободы числителя и nзн = = n2  = N
— числа степеней свободы знаменателя (для q = 5%; nчисл = 3 – 1 = 2; nзн = 8, = 0,5157, см. таблицу А.6), то гипотеза об однородности дисперсий принимается. При этом всю группу дисперсий можно  считать оценкой S 2{Y} одной и той же генеральной дисперсии воспроизводимости s 2{Y}, откуда

                                (2.8)

Следует также отметить, что критерий Кохрена можно применять не к любой группе выборок, а только к группе выборок одинакового объема, что как раз и имеет место при планировании эксперимента.

Если число опытов, попавших в каждую строку плана эксперимента, будет неодинаковым, то для проверки воспроизводимости опытов следует использовать критерий Бартлетта

                       (2.9)

где       — поправочный коэффициент;

 — средневзвешанная дисперсия (эквивалентна дисперсии );

 — общее число степеней свободы плана (эквивалентно );

–1 — дисперсия и число степеней свободы g-й строки плана, объем   выборки которой равен mg ;

   N — число строк плана.

Если проверка на воспроизводимость дала отрицательный результат, то остается признать невоспроизводимость эксперимента относительно управляемых переменных вследствие наличия флуктуаций неуправляемых и неконтролируемых переменных, создающих на выходе большой уровень «шума». При этом следует увеличить число параллельных опытов.

1.4  Получение  математической  модели  объекта

и  проверка  ее  адекватности

Математическая модель объекта, получающаяся в результате ПФЭ, может быть представлена в виде

Y = b0  + b1 x1  + … + bn xn  + b12 x1 x2  + … + bn-1,n xn-1 xn +

+ b123 x1 x2 x3 + … + b123…n x1 x2 x3 … xn.                            (2.10)

Однако вследствие того, что из ограниченного числа опытов нельзя получить точные значения коэффициентов bi, а только их независимые оценки bi, вся математическая модель становится оценочной

= b0  + b1 x1  + … + bn xn  + b12 x1 x2  + … +  b1…n x1 … xn.                   (2.11)

Оценки коэффициентов уравнения регрессии легко найти по формуле

                                                    (2.12)

или                                     (2.13)

где mg — число попаданий Ygl в g-ю строку.

После определения оценок коэффициентов регрессии необходимо проверить гипотезу о значимости коэффициентов bi. Лучше всего это сделать в виде нуль-гипотезы, т.е. гипотезы о равенстве bi = 0. Если она подтвердилась, то коэффициент bi следует признать статистически незначимым и отбросить из искомой модели; если гипотеза не подтвердилась, то соответствующий коэффициент bi следует признать значимым и включить в модель.

Проверка гипотезы проводится с помощью t-критерия Стьюдента, который при проверке нуль-гипотезы формируется в виде

                                         (2.14)

где S2 {bi}
— дисперсия ошибки определения коэффициента bi. Для всех i

                                                      (2.15)

или                                                                                                        (2.16)

Если вычисленная величина параметра ti не превышает табличное значение tT, найденное для q%-го уровня  значимости и n3 = N (m-1) числа степеней свободы (например,  для q = 5%; n3 = 16; tT
= 2,199, см. таблицу А.2), то нуль-гипотеза принимается, коэффициент bi
считается незначимым и его следует отбросить, не включать в искомую модель.

Статистическая незначимость коэффициента bi может быть обусловлена следующими причинами:

1) уровень базового режима  близок к точке частного экстремума по переменной Xi  или по произведению переменных;

2) шаг варьирования D Xi выбран малым;

3) данная переменная (или произведение переменных) не имеет функциональной связи с выходным параметром Y;

4)  велика ошибка эксперимента вследствие наличия неуправляемых и неконтролируемых переменных.

Поскольку ортогональное планирование позволяет определять доверительные границы для каждого из коэффициентов регрессии в отдельности, то если какой-либо из коэффициентов окажется незначимым, он может быть отброшен без пересчета всех остальных. После этого математическая модель объекта составляется в виде уравнения связи выходного параметра Y и переменных Xi, включающего только значимые коэффициенты.

Чтобы проверить гипотезу об адекватности представления результатов эксперимента найденному уравнению связи (иными словами, чтобы проверить, насколько найденное уравнение соответствует экспериментальным результатам), достаточно оценить отклонение выходной величины , предсказанное уравнением регрессии, от результатов экспериментов  в точках  факторного пространства.

Рассеяние результатов эксперимента вблизи уравнения связи, аппроксимирующего искомую функциональную зависимость, можно охарактеризовать с помощью дисперсии неадекватности , оценка которой находится по формуле

                                        (2.17)

с числом степеней свободы nад = Nd, где d
— число членов аппроксимирующего полинома.

Проверка адекватности состоит в выяснении соотношения между дисперсией неадекватности  и дисперсией воспроизводимости {Y}. Если  не превышает дисперсии опыта, то полученная математическая модель адекватно представляет результаты эксперимента, если же > {Y}, то описание считается неадекватным объекту.

Проверка гипотезы об адекватности проводится с использованием F-критерия Фишера. Критерий Фишера позволяет проверить нуль-гипотезу о равенстве двух генеральных  дисперсий  и {Y}. F-критерий формируется как отношение

                                                              (2.18)

Если вычисленное по формуле (2.18) значение критерия FP меньше табличного FT, найденного для q %-го уровня значимости, nчисл = nад = n4 = Nd числа степеней свободы числителя и nзн = n3 = N (m — 1) числа степеней свободы знаменателя, то нуль-гипотеза принимается. В противном случае она отвергается и описание (модель) признается неадекватным объекту. Некоторые  значения FТ
(q = 5 %; n4; n3) приведены в таблице А.5.

В ходе работы может возникнуть ситуация, когда выборочная дисперсия неадекватности  не превосходит оценки дисперсии воспроизводимости  S2{Y} (т.е. когда £ S2{Y}). Тогда соотношение (2.18) будет равно £ 1 и неравенство
< выполняется для любого числа степеней свободы n4 и n3, т.е. гипотеза  £ {Y} не противоречит выборочным данным и математическая модель адекватно представляет объект.

Проверка адекватности возможна только при nад = n4 > 0. Число вариантов варьирования плана ПФЭ равно числу оцениваемых коэффициентов регрессии уравнения связи (N = d). Следовательно, не остается степеней свободы (nад = 0) для проверки нуль-гипотезы об адекватности представления экспериментальных данных выбранной формой аппроксимирующего полинома. Если же некоторые коэффициенты регрессии оказались незначимыми или ими можно пренебречь в силу их малости, то число членов проверяемого уравнения в этом случае будет меньше числа вариантов  варьирования (d < N), и одна или несколько степеней свободы (nад > 0) останется для проверки гипотезы адекватности.

Если гипотеза адекватности отвергается, необходимо перейти к более сложной форме уравнения связи либо, если это возможно, провести эксперимент с меньшим шагом варьирования.

2  РАСЧЁТ  ПРИМЕРА

Поскольку в распоряжении студента нет объекта, изменяя воздействия на вход которого согласно плана эксперимента (типа обозначенного в таблице 2.1) можно было бы его реализовать по полной программе, можно использовать приём, который называется “квазиактивный эксперимент”. Суть его состоит в том, чтобы воспользоваться планом ПФЭ, а наполнение взять из исходной таблицы данных.

С этой целью и для увеличения точности результатов будущих расчетов весь  диапазон Хkmax – Xkmin
каждого фактора Хk следует разбить на три части таким образом, чтобы число попаданий в каждую из них было примерно одинаковым, при этом части следует кодировать символами –1, 0 и +1. Хотя вид закона распределения факторов не оговаривается, из практики известно, что в подавляющем большинстве случаев они унимодальны (одновершинны), и для них можно оговорить правило: все значения Хk £ –0,5Sk будут относиться к области хk = –1, все значения Хk ³ +0,5Sk — к области хk
= +1, а остальные значения Хk — к области хk
= 0 (здесь  — среднее арифметическое, Sk — среднеквадратическое отклонение числового значения фактора Хk, определенное по достаточно большому объему выборки, причем символом Хk обозначаются значения k-го фактора в абсолютных единицах, а хk — в относительных (см. таблицу 2.2)). В результате исходная таблица с контрольно-измерительной информацией превращается в план квазиактивного эксперимента. При переходе к относительным координатам толщина оболочки гиперсферы увеличивается (или, иначе, вместо точечных вершин гиперкуба появляются некоторые «вершинные» области).

Таблица 2.2 — Переход

к относительным координатам

Факторы

Области

xk = –1

xk = +1

X1

X2

X3

£ 212.8

£ 252.3

£   20.9

³ 262.4

³ 290.7

³   25.0

Напоминаем, что в таблицу ПФЭ следует записать не менее m = 3 циклов экспериментальных данных, но и слишком много нельзя — будут искажения результатов. Обычно m = 3÷6. Что касается рандомизации, то она заложена в таблице исходных данных. Результаты расчётов представлены в таблице 2.3.

Таблица 2.3 — План и результаты ПФЭ

g

План эксперимента

Ygl

x1

x2

x3

x1x2

x1x3

x2x3

x1x2x3

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

+

57,1

55,2

58,5

76,3

59,5

69,9

63,7

80,0

47,1

60,2

60,6

71,4

61,3

61,0

68,0

73,5

54,0

53,8

54,6

78,4

57,5

64,5

62,5

78,7

52,4

59,3

61,3

73,0

59,2

65,4

64,5

77,5

52,65

57,12

58,75

74,85

59,37

65,20

64,67

77,42

17,497

9,649

9,070

10,750

2,422

13,420

5,589

7,889

53,10

58,24

58,80

73,22

58,92

64,06

63,44

79,04

0,2025

1,2544

0,0025

2,6569

0,2025

1,2996

1,5129

2,6244

S (×)

76,286

9,7557

Проверка на воспроизводимость по критерию Кохрена:

== 0,2294 < GT (5%; nчис = 3; nзн = 8;) = 0,4377.

Значит, = 9,536 с n3 = 24 степенями свободы.

b1 = = 4,894;       b2 = = 5,169;     b3 = = 2,911;

b12 = 2,319;       b13 = –0,249;   b23 = –0,789;   b123 = –0,589.

0,298; =0,5459;

t1=8,965;   t2=9,469;   t3=5,332;   t12=4,248;   t13=0,456;   t23=1,445;   t123=1,079.

Окончательно модель имеет вид

= 63,75 + 4,89х1
+ 5,17х2 + 2,91х3 + 2,32х1х2.

= =3,252;   =<1. Модель адекватна.

3  ПОРЯДОК  ПРОВЕДЕНИЯ  РАБОТЫ

3.1 Создать таблицу перехода данных в относительную систему координат.

3.2 Составить план проведения ПФЭ. Число параллельных опытов взять не менее трех (m = 3÷6).

3.3 На основе таблицы исходных данных провести эксперимент по разработанному плану.

3.4 Обработать результаты эксперимента:

а) провести проверку воспроизводимости;

б)  рассчитать  коэффициенты уравнения, определить дисперсии коэффициентов, проверить значимость коэффициентов;

в) проверить адекватность полученной математической модели.

3.5 Оформить отчет со всеми таблицами и вычислениями.

При подготовке к защите лабораторной работы необходимо ознакомиться с контрольными вопросами и продумать ответы на них.

4  КОНТРОЛЬНЫЕ   ВОПРОСЫ

4.1 В чем различие  между физическим и математическим моделированием?

4.2 Как  графически  можно интерпретировать математическое описание объекта в виде полинома?

4.3 Каковы предпосылки построения плана и определения регрессионного уравнения?

4.4  Что  называется полным и дробным факторным экспериментом?

4.5  При  каких  условиях не выполняется проверка воспроизводимости?

4.6  При каких условиях не выполняется проверка адекватности?

4.7  При каких условиях коэффициенты регрессии будут незначимыми?

4.8 Как составляется матрица планирования ПФЭ?

4.9 Указать порядок проведения эксперимента методом ПФЭ.

4.10  Указать преимущества факторного планирования эксперимента.

4.11 Как проверить равноточность воспроизводимости  отдельных опытов ПФЭ?

4.12 Как проверить значимость коэффициентов регрессии?

4.13 Как проверить адекватность  представления  результатов экспериментов выбранной математической моделью?

4.14  Как выбираются факторы планирования и шаги варьирования?

5  РЕКОМЕНДУЕМАЯ   ЛИТЕРАТУРА

5.1 Долгов Ю.А. Статистическое моделирование: Учеб. для вузов.- Тирасполь: РИО ПГУ, 2002. – С. 110 – 124.

5.2 Глудкин О.П., Обичкин Ю.Г.,  Блохин В.Г. Статистические методы  в технологии производства РЭА  / Под ред. В.Н.Черняева. — М.: Энергия, 1977. — 296 с. (С.49-53; 68-82)

5.3 Барабащук В.И., Креденберг Б.И., Мирошниченко В.И. Планирование  эсперимента в технике / Под ред. Б.И.Креденберг. — Киев: Техника, 1984. — 200 с. (С.11-23, 40-46, 52-56)

5.4 Большев Л.Н., Смирнов Н.В.Таблицы математической статистики. — М.: Наука, 1983. – С. 100, 366-370.