Метод наименьших квадратов


Суть метода наименьших квадратов (МНК) заключается в том, чтобы по экспериментальным данным подобрать такую теоретическую кривую, у которой

clip_image002 (2.34)

где clip_image004 — теоретические, а clip_image006 — экспериментальные значения кривой в точках clip_image008. Решая такую систему нормальных уравнений можно получить параметры реального уравнения регрессии.

Подбор теоретической кривой называется сглаживанием. Известны сглаживания с помощью прямой, параболы, экспоненты, показательной функции и т.д. Чтобы принять решение о виде кривой сглаживания, необходимо иметь представление о характере изменения экспериментальных данных. Для этих целей лучше всего подойдет график, построенный по результатам табл.2.1 в координатах clip_image010

Достаточно большой класс кривых сглаживаются функциями с двумя параметрами. К ним относятся в первую очередь прямая clip_image012а также ряд других функций, которые могут быть сведены к уравнению прямой различными преобразованиями. То же относится и к классу функций с тремя параметрами, простейшей из которых является парабола clip_image014, а также ряд других функций, которые могут быть сведены к уравнению параболы различными преобразованиями. В табл.2.2 приведены 19 различных видов моделей, основанных на этом принципе.

Для оценки качества модели рассчитывают её среднеквадратическую ошибку

clip_image016, (2.35)

среднеквадратическую ошибку исходной выборки

clip_image018, (2.36)

а также индекс корреляции с учётом использованных степей свободы

Таблица 2.3

Модели МНК

Шифр

модели

Вид модели

Преобразования

Системы нормальных уравнений

М1

Y = a+bX

 

clip_image020

М2

Y = a+bX+cX2

 

clip_image022

М3

Y = a+b?lnX

lnX=u;

Y=a+bu

clip_image024

М4

Y=a+b?lnX +с(lnX)2

lnX=u;

Y=a+bu+cu2

clip_image026

М5

clip_image028

clip_image030;

Y=a+bu

clip_image032

М6

clip_image034

clip_image030[1];

Y= a+bu+cu2

clip_image026[1]

М7

Y = abX

lnY=z; lna=k1;

lnb=k2

z=k1+k2X

clip_image036

М8

Y = aXb

lnY=z; lna=k;

lnX=u; z=k+bu

clip_image038

М9

clip_image040

lnY=z; lna=k;

clip_image030[2]; z=k+bu

clip_image038[1]

М10

Y = abXXc

lnY=z; lna=k1;

lnb=k2; lnX=u;

z=k1+k2X+cu

clip_image042

Продолжение табл.2.3.

Шифр

модели

Вид модели

Преобразования

Системы нормальных уравнений

М11

Y = abX(lnX)c

lnY=z; lna=k1;

lnb=k2

ln(lnX)=u; z=k1+k2X+cu

clip_image042[1]

М12

clip_image044

lnY=z; lna=k1;

lnb=k2

lnc=k3;

z=k1+k2X+k3X2

clip_image046

М13

clip_image048

clip_image030[3];

Y=a+bX+cu

clip_image050

М14

Y = a+bX+c?lnX

lnX=u;

Y=a+bX+cu

clip_image052

М15

Y = a+clip_image054 + c?lnX

clip_image030[4]; lnX=v;

Y=a+bu+cv

clip_image056

М16

Y = a+b?lnX +ce-X

lnX=u; e-x=v;

Y=a+bu+cv

clip_image058

М17

Y = a+bX2+ce-X

X2=u; e-X=v;

Y=a+bu+cv

clip_image058[1]

М18

Y = a+bX2+c?lnX

X2=u; lnX=v; Y=a+bu+cv

clip_image058[2]

М19

clip_image061

clip_image063;clip_image030[5];clip_image065;clip_image067; z=k1+k2u

clip_image069

clip_image071, (2.37)

где clip_image073 — экспериментальное и соответствующее ему по модели расчетное значение для величин clip_image075; clip_image077 — среднее арифметическое выборки; N – объем выборки; m – количество параметров модели (коэффициентов a, b, c).

Значение индекса корреляции находятся в диапазоне 0clip_image079; если подкоренное выражение в формуле (2.37) принимает отрицательное значение, то испытуемая модель бесполезна. Лучшей признается та модель, для которой выражение (2.37) имеет максимальную, а выражение (2.35) минимальную величину.

Вообще говоря, метод наименьших квадратов, будучи проще метода Чебышева по вычислительной процедуре, обладает по сравнению с ним тремя недостатками: нет твердой гарантии в самом факте корреляции между случайными величинами; для выбора наилучшей модели необходимо найти два десятка вариантов, что резко увеличивает трудоёмкость метода (для ПЭВМ это не помеха); коридор существования модели может быть заужен вследствие работы с усреднёнными данными.

Пример 4. По крайним столбцам табл.2.1clip_image081 найти наилучшую модель МНК и сравнить её с моделью примера 1.

Р е ш е н и е: Последовательно используя формулы табл. 2.3 найдём соответствующие параметры моделей, их индексы корреляции и СКО. Результаты представлены в табл. 2.4.

Анализ результатов табл.2.3 приводит к выводу, что наилучшей следует признать модель М2

clip_image083,

clip_image085

Рис.2.3. Модели, найденные методом Чебышева (1) и МНК (2).

Таблица 2.4

Модели по данным табл. 2.1.

Шифр

модели

Модель

i

i’

clip_image087

М1

clip_image089

0,9419

0,9334

2,7848

М2

clip_image091

0,9916

0,9888

1,1578

М3

clip_image093

0,8989

0,8835

3,6336

М4

clip_image095

0,8636

0,8131

4,5164

М5

clip_image097

0,8994

0,8837

3,6093

М6

clip_image099

0,9613

0,9481

2,4678

М7

clip_image101

0,9544

0,9477

2,4771

М8

clip_image103

0,9148

0,9020

3,3499

М9

clip_image105

0,3607

0,0766

7,7353

М10

clip_image107

0,9900

0,9867

1,2632

М11

clip_image109

0,9895

0,9860

1,2945

М12

clip_image111

0,9443

0,9250

2,9480

М13

clip_image113

0,9845

0,9793

1,5710

М14

clip_image115

0,9438

0,9243

2,9613

М15

clip_image117

9,4156

М16

clip_image119

0,8452

0,8173

7,2814

М17

clip_image121

0,9621

0,9433

4,1841

М18

clip_image123

0,9905

0,9873

1,2306

М19

clip_image125

0,8735

0,8539

4,0355

которая очень похожа на модель, найденную в примере 1 по методу Чебышева. Для наглядности обе модели и экспериментальные точки представлены на рис.2.2

Обе модели практически совпадают, так что пользоваться можно любой из них, однако следует помнить, что:

1) метод Чебышева лучше всего применять при первоначальных исследованиях, а МНК – при повторных, когда определена форма кривой, иначе трудоемкость МНК резко возрастает;

2) метод Чебышева дает, а МНК не дает коридора существования модели (напомним, что модель есть регрессия, т.е. уравнение геометрического места проекций центров условных распределений).

Примечание. Вообще говоря, модели М2, М10, М11, М18 практически неотличимы друг от друга, однако при прочих равных условиях предпочтение следует отдавать простейшей из них.

Загрузка...