МЕТОД НАИМЕНЬШИX КВАДРАТОВ С ПРЕДВАРИТЕЛЬНОЙ ОРТОГОНАЛИЗАЦИЕЙ ФАКТОРОВ


Лабораторная  работа № 7

Цель работы
выработать навыки обработки результатов пассивного эксперимента для нахождения математической модели исследуемого объекта с помощью метода наименьших квадратов с предварительной ортогонализацией факторов.

1 Общие положения

1.1  Предпосылки  метода

Один  из  самых старых и разработанных методов моделирования по пассивным  данным — метод наименьших квадратов (МНК), который базируется на  подборе  такого  уравнения регрессии, чтобы сумма квадратов разности между уравнением и экспериментальными данными была наименьшей из всех возможных. Оценки коэффициента регрессии в МНК ищутся по формуле

                                            (7.1)

где          B — матрица искомых коэффициентов регрессии;

(XТ X)-1 — матрица, обратная матрице системы нормальных уравнений;

XТ Y — матрица произведений транспонированной матрицы факторов X и матрицы откликов Y.

Для произвольной системы факторов задача нахождения обратной матрицы является довольно громоздкой даже для ЭВМ, причем трудоемкость стремительно возрастает с увеличением числа факторов. Одновременно существует еще одна проблема — при признании какого-либо из найденных коэффициентов bk
незначимым следует, исключив фактор Xk, всю вычислительную процедуру проделать заново с самого начала. Проблема существенного упрощения процедуры определения коэффициентов регрессии и отсеивания незначимых факторов может быть решена путем предварительной ортогонализации факторов, т.е. подбором для каждой регрессионной задачи своей специальной системы линейно-независимых функций Y(X) таких, чтобы матрица системы нормальных уравнений (XTX) была единичной. Другими словами, каждая функция Ykj(X) из системы линейно-независимых функций Y(X) выбирается так, чтобы она была ортогональна ко всем предыдущим и нормирована на заданном множестве экспериментальных точек Xkj
с весами wkj. Тогда матрица (XT X)-1 также будет единичной и выражение (7.1) упрощается

                                           (7.2)

Теперь  не только нет необходимости искать обратную матрицу, но и можно отбрасывать незначимые коэффициенты регрессии без пересчета остальных.

Выбор  системы  функций Y(X) осуществляется с использованием ортогональных полиномов Чебышева таким образом, чтобы кривая Y(X) разлагалась по выбранной системе функций в ряд, быстро сходящийся в  каждой точке Xkj. При этом система функций должна быть определена на том интервале значений переменной Xk, на котором расположены экспериментальные точки. Следовательно,  метод наименьших квадратов с предварительной ортогонализацией (МНКО) сводится к тому, что связь между выходной величиной Y
и факторами Xl

Y
= f(X1,X2,…,Xl,…,Xn
),      l = 1,…,n ,

будем искать в виде следующего полинома, включающего эффекты факторов и их взаимодействий:

               (7.3)

где   n — количество рассматриваемых факторов;

q = 0,…, p
— степень полинома, представляющего соответствующий фактор.

Однако такой полином, как указывалось выше, трудно найти без предварительной  ортогонализации, поэтому промежуточной целью будет поиск вспомогательного полинома следующего вида

                                      (7.4)

Здесь  m + 1 — число членов уравнения регрессии. Имея в виду, что при  обработке пассивной контрольно-измерительной информации степень каждого  фактора p на практике не превышает 2, а число взаимодействий ограничивается парным, то общее число членов уравнения регрессии не будет превышать m+1£ 1+2n+. При этом для  удобства  следует производить замену переменных и вместо эффектов  факторов Xl
и их взаимодействий вводить единую переменную Zk .

Необходимо отметить, что степень полинома Yk(Z) совпадает с номером  столбца k рассматриваемых эффектов Zk
в матрице исходных данных. Тогда  именно на полиномы Yk(Z) следует наложить условия ортогонализации

        ( 7.5)

Решением системы уравнений (7.5) будет достаточно простая итеративная процедура

                   (7.6)

где               (7.7)

1.2  Расчетные  формулы  и  алгоритм  определения  модели    

Задача определения оценок коэффициентов bk
уравнения (7.3) сводится к нахождению коэффициентов Аk при ортогональных полиномах в (7.4) исходя из  условий  минимизации  остаточной суммы квадратов

                   (7.8)

Дифференцируя (7.8) по каждому коэффициенту Аk
и приравнивая результат дифференцирования к нулю, получаем систему (m+1) линейных уравнений, решением которой будет выражение для расчета Аk

                      (7.9)

Из полученной формулы видно, что все коэффициенты Аk
определяются независимо друг от друга, так как рассматриваются на основе ортогональных полиномов  различных  порядков. Следовательно, вопрос о включении в уравнение (7.4) каждого коэффициента Аk проверяется по критерию Стьюдента. Для этого предварительно рассчитывается среднеквадратическое отклонение очередного коэффициента Аk.

                                                          (7.10)

где S2 {Y} — средняя (или средневзвешенная) дисперсия выходной величины  по  неповторяющимся  строкам плана (может быть определена специальными дублирующими опытами в любой точке изучаемой области факторного пространства, лучше всего в центре). В крайнем случае для оценки средней дисперсии можно взять эмпирическую дисперсию распределения выходной величины, деленную на 4 (минимальное число равнодействующих составляющих, которые могут дать нормальное распределение).

Величина S{Ak} подставляется в выражение для расчетного критерия Стьюдента

                       (7.11)

При выполнении условия (7.11) коэффициент Аk признается значимым и должен быть включен в уравнение (7.4), в противном случае — нет.

Проверка адекватности уравнения (7.4) экспериментальным данным осуществляется как обычно, с помощью критерия Фишера. В случае положительного  решения можно перейти к отысканию оценок bk
в уравнении (7.3).

Простейшим методом нахождения  bk
является метод подстановки соответствующих  конкретных  значений yk(Z) в (7.4) и приведения подобных  членов.  Выражения,  стоящие перед каждым Zk,  являются искомыми оценками коэффициентов  bk. Результат может быть представлен в рекуррентном виде

    (7.12)

Следует обратить внимание, что в выражении (7.12) в связи с обратным  отсчетом номера k = m,…,0 индексы отношения xik
также изменены на обратные по сравнению с выражением (7.5). Другими словами, принцип старшинства индексации для первого сомножителя числителя по-прежнему соблюдается.

Анализ особенностей МНКО как в теоретическом плане, так и в плане практического  применения  позволяет  обратить внимание на следующее.

1. В  условиях пассивного эксперимента оценки коэффициентов bk в отличие от Аk
являются смешанными. Однако по сравнению с МНК предложенный  метод  позволяет точнее оценить независимый вклад каждого эффекта в соответствующий  коэффициент bk. Это обстоятельство  обусловливает более  высокую чувствительность МНКО по сравнению с МНК, которая тем выше, чем больше количество исследуемых факторов, причем в этот список могут входить как сильно-, так и слабодействующие факторы.

2. Эффективность метода зависит от порядка следования факторов (эффектов) друг за другом при расчете коэффициентов модели. В случае расположения их в порядке убывания по степени значимости эффективность метода возрастает. Поэтому целесообразно перед применением МНКО предварительно расположить исследуемые факторы (эффекты) в порядке убывания значимости (степени влияния) по отношению к целевой функции. Для этого можно рекомендовать воспользоваться предварительной моделью, полученной с помощью ММСБ или какого либо другого метода.

3. Существенной особенностью и преимуществом МНКО является то обстоятельство, что в силу перехода данных в заведомо ортогональную систему координат можно получать оценки коэффициентов и для коррелированных факторов и для квадратов членов.

4. Другой существенной особенностью и преимуществом МНКО является то, что  для получения модели не требуется слишком длинной таблицы исходных данных как в ММСБП, лишь бы координаты точек факторного пространства были бы достаточно далеки друг от друга.

5. Модель МНКО является обычным алгебраическим выражением, коэффициенты её представляют собой смешанные оценки и не являются, как в ММСБ, весами соответствующих факторов.

1.3 Расчет  производственного примера

Найдем математическую модель с помощью МНКО по результатам пассивного эксперимента, представленным в таблице 7.1. Обозначаем через Z1=X1, Z2 = X2, Z3 = X3. Остальные факторы признаем незначимыми и их не рассматриваем.

Расчеты дают следующие результаты:

Таблица 7.2 – Вспомогательные коэффициенты

      k

i

0

1

2

       1

       11,42

       2

      15,3

    0,944

       3

      136,0

    –1,192

      0,691

Тогда ортогональные полиномы можно подсчитать по формуле (7.5), конкретные числовые значения см. в таблице 7.3.

Так как дисперсия опытов  неизвестна, то ее придется определять из дисперсии распределения S2{Y} как

= S2 {Y} / 4 = 72,03 / 4 = 18,006.

Тогда по формулам (7.9), (7.10) и (7.11) определяем:

A0 = 43,57;  S{A0} = 1,342 ;t0 = 32,466;

A1 = 2,268; S{A1} = 0,794;   t1 =  2,856;

A2 =  2,746; S{A2} = 0,821;  t2 =  3,345;

A3 = 0,0144; S{A3} = 0,067; t3 =  0,215.

Таблица 7.3 — Ортогональные полиномы и проверка модели на

                        адекватность

Табличное значение критерия Стьюдента tт
(5%; 9) = 2,26. Поэтому в модель войдут только три члена

 = 43,57 + 2,268 y1(Z)+ 2,746 y2(Z).

Проверка модели типа (4.4) на адекватность дает неравенство

= = 42,868;

= =2,37<Fт (5%; nад = 7; nр = 9) = 3,32,

что позволяет перейти к расчету коэффициентов bk:

b3 = 0;    b2 = A2=2,746; b1=A1
b2x21 = — 0,324;    b0 = A0  — b1x10 — b2x20
= 5,256.

Таким образом, искомая модель в декартовых координатах имеет вид

= 5,256 — 0,324X1 + 2,746X2.

В справедливости полученной модели, помимо всех приведенных доказательств, можно убедиться путем подстановки в нее строк таблицы 7.1 и сравнения полученных результатов с экспериментальными данными.

Таблица 7.1 – Результаты пассивного эксперимента

j

X1

X2

X3

Y

1

2

3

4

5

6

7

8

9

10

11,2

12,0

12,0

7,5

10,2

13,0

13,6

12,9

10,2

11,6

15

18

15

9

16

16

16

15

16

17

106

170

120

150

160

139

145

120

110

140

35,0

51,1

54,8

28,3

40,6

44,3

45,5

35,9

49,2

52,0

11,42

15,3

136,0

43,57

2  Порядок проведения работы

2.1.  Для проведения лабораторной работы в качестве исходной таблицы данных следует принять таблицу, полученную в результате выявления нескольких (N = 8÷15) строк из первоначальной таблицы данных с помощью рандомизации (легко сделать по номерам таблицы равномерно распределённых случайных чисел — таблицы А.7).

2.2.  Определить ортогональные полиномы и вспомогательные коэффициенты xki для всех трех факторов и их взаимодействий в порядке убывания значимости по результатам расчетов лабораторной работы 6. Для удобства дальнейшей работы численные значения полиномов необходимо свести в таблицу, подобную таблице 7.3.

2.3.  Определить коэффициенты Ak для всех факторов и их парных взаимодействий.

2.4.  Определить значимость найденных коэффициентов Ak. В качестве дисперсии опытов принять величину  из лабораторной работы 3 или одну четвертую дисперсии распределения выходной величины Y, как окажется удобнее.

2.5.  Доказать адекватность полученной модели.

2.6.  Перевести найденную модель в декартовы координаты.

3 Содержание отчёта

Отчет о лабораторной работе должен содержать ответы на все пункты задания с приведением необходимых формул, расчетов, таблиц. При подготовке к защите необходимо ознакомиться с контрольными вопросами и продумать результаты работы, обратив особое внимание на те пункты, в которых наблюдается расхождение с результатами предыдущих лабораторных работ.

4  Контрольные вопросы

4.1.  Какая основная идея лежит в основе метода наименьших квадратов?

4.2.  В чем достоинства и недостатки метода наименьших квадратов?

4.3.  Какова основная идея, лежащая в основе МНКО? Какими особенностями МНК она вызвана?

4.4.  Почему в МНКО необходимо делать замену переменных?

4.5.  Какие свойства должны иметь ортогональные полиномы?

4.6.  В чем заключается итеративная процедура вычисления ортогональных полиномов?

4.7 Почему в МНКО необходимо получать промежуточную модель в координатах ортогональных полиномов?

4.8. Как в МНКО произвести отсеивание незначимых факторов?

4.9.  Как доказать адекватность модели?

4.10.  Каким образом можно произвести обратный переход из координат ортогональных полиномов в декартовы координаты?

4.11.  Зачем необходимо отыскивать модель в именованных единицах измерения (в декартовой системе координат)?

4.12.  Каковы свойства (отличия) моделей в ортогональных полиномах и декартовых координатах?

4.13.  Достоинства и недостатки МНКО.

5  Рекомендуемая литература

5.1.  Долгов Ю.А. Статистическое моделирование; Учебник для вузов. — Тирасполь; РИО ПГУ, 2002.- 280с. (С. 183-192.)

5.2.  Адлер Ю.П., Маркова Е.В., Грановский Ю.В. Планирование эксперимента при поиске оптимальных условий. — 2-е изд., перераб. и доп. — М.: Наука, 1976. — 279 с.

5.3.  Джонсон Н., Лион Ф. Статистика и планирование эксперимента в технике и науке. Методы обработки данных /Пер.с англ. Под ред. Э.К.Лецкого, Е.В.Марковой. — М.: Мир, 1980. — 610 с.

5.4. Долгов Ю.А., Шестакова Т.В. Метод моделирования технологических процессов серийного производства // Технология и конструирование в электронной аппаратуре. — 1992. — № 4 — 1993. — № 1. — С. 23 — 25.