КАТЕГОРИИ:


Астрономия- (809) Биология- (7483) Биотехнологии- (1457) Военное дело- (14632) Высокие технологии- (1363) География- (913) Геология- (1438) Государство- (451) Демография- (1065) Дом- (47672) Журналистика и СМИ- (912) Изобретательство- (14524) Иностранные языки- (4268) Информатика- (17799) Искусство- (1338) История- (13644) Компьютеры- (11121) Косметика- (55) Кулинария- (373) Культура- (8427) Лингвистика- (374) Литература- (1642) Маркетинг- (23702) Математика- (16968) Машиностроение- (1700) Медицина- (12668) Менеджмент- (24684) Механика- (15423) Науковедение- (506) Образование- (11852) Охрана труда- (3308) Педагогика- (5571) П Arhitektura- (3434) Astronomiya- (809) Biologiya- (7483) Biotehnologii- (1457) Военно дело (14632) Висока технологиите (1363) Geografiya- (913) Geologiya- (1438) на държавата (451) Demografiya- ( 1065) Къщи- (47672) журналистика и SMI- (912) Izobretatelstvo- (14524) на външните >(4268) Informatika- (17799) Iskusstvo- (1338) История- (13644) Компютри- (11121) Kosmetika- (55) Kulinariya- (373) култура (8427) Lingvistika- (374) Literatura- (1642) маркетинг-(23,702) Matematika- (16,968) инженерно (1700) медицина-(12,668) Management- (24,684) Mehanika- (15423) Naukovedenie- (506) образование-(11,852) защита truda- (3308) Pedagogika- (5571) п Политика- (7869) Право- (5454) Приборостроение- (1369) Программирование- (2801) Производство- (97182) Промышленность- (8706) Психология- (18388) Религия- (3217) Связь- (10668) Сельское хозяйство- (299) Социология- (6455) Спорт- (42831) Строительство- (4793) Торговля- (5050) Транспорт- (2929) Туризм- (1568) Физика- (3942) Философия- (17015) Финансы- (26596) Химия- (22929) Экология- (12095) Экономика- (9961) Электроника- (8441) Электротехника- (4623) Энергетика- (12629) Юриспруденция- (1492) Ядерная техника- (1748) oligrafiya- (1312) Politika- (7869) Лево- (5454) Priborostroenie- (1369) Programmirovanie- (2801) производствено (97182) от промишлеността (8706) Psihologiya- (18,388) Religiya- (3217) с комуникацията (10668) Agriculture- (299) Sotsiologiya- (6455) спортно-(42,831) Изграждане, (4793) Torgovlya- (5050) превозът (2929) Turizm- (1568) физик (3942) Filosofiya- (17015) Finansy- (26596 ) химия (22929) Ekologiya- (12095) Ekonomika- (9961) Telephones- (8441) Elektrotehnika- (4623) Мощност инженерно (12629) Yurisprudentsiya- (1492) ядрена technics- (1748)

Регресионен анализ Page 1




Специфика на обработка на експерименталните резултати от

3.3.1 Характеристики на изчисляването на коефициентите на регресия

Значителни нови възможности, открити след в регресионен анализ са въведени идеята за експериментален дизайн. Така че, когато планирате ортогонална матрица на коефициентите на нормалните уравнения става диагонал и диагоналните елементи са равни на броя N на експерименти в матрицата на график. Това значително намалява трудностите, свързани с изчисляването на коефициентите на регресия уравнението. Поради факта, че матрицата на ковариация Също така е по диагонал, всички коефициентите на регресионното уравнение са несвързани помежду си помежду си. В този случай, значимостта на коефициентите може да се провери за всеки от тях поотделно и, съответно, с изключение на регресията на който и да е незначителен фактор няма да се отрази на останалите. коефициенти Б и не са смесени, ще бъдат оценени за съответните магистърски коефициентите И техните количества ще са характерни за приноса на всеки фактор в Y. изходната параметър Освен това следва да се отбележи, че диагоналните елементи на матрицата на ковариация са равни една на друга, така че всички регресионни коефициенти В, и се определят с еднаква точност. С оглед на изложеното по-горе, резултатите от обработката на активните регресия уравнение коефициентите на експеримента по метода на най-малките квадрати са дефинирани както следва:


, , (3.26)

От израза (3.26), следва, че всеки коефициент на регресия уравнение б и определя от скаларен продукт на база през колона х и съответстваща на колоната, разделен на броя на опитите в график матрица N на:

, (3.27)

Векторът изчисляване и определяне на приблизителна уравнение на регресията се пристъпи към неговото статистически анализ.

3.3.2 Характеристики на статистическия анализ на уравнението на регресия

Както и при обработката на резултатите от пасивен експеримент, статистически анализ започва с проверка на адекватността на приблизителното уравнение на резултатите от регресия на експеримента. Съответствието на уравнението се проверява с теста на Fisher:

, (3.28)

Когато това се сравнява между адекватност дисперсия и дисперсията на възпроизводимостта , Помислете за физическия смисъл и причините за използването съгласно (3.28) изчисленията на промяната и ,

Ако знаехме предварително, че в резултат на математически модел описва адекватно на процеса, като мярка за дисперсията на адаптивна шума (шум на експеримента) могат да бъдат взети като остатъчна дисперсия (виж 3.23) , В този случай, съгласно (3.19) за проверка на съответствието трябва да се използва съотношение остатъчна дисперсия към дисперсията на възпроизводимостта ,



Това е адекватен модел за единствената причина за разликите между действителната стойност на отговор и предсказано от уравнението на регресия То може да бъде влиянието на шума , Ето защо остатъчната дисперсия е прогнозата за , Когато математическия модел не е адекватно, остатъчната разлика ще бъде оценен в същото време и с няколко допълнителни компонента на разсейване, поради неадекватността на модела.

Но тъй като на адекватността на модела, не можем предварително известни, приблизителната оценка на разсейването на добавка шум на практика определя от резултатите от паралелни експерименти (повтаря наблюдения за същите стойности на входните фактори). Тази прогноза се нарича дисперсия на възпроизводимост ,

Въз основа на изложеното по-горе, дисперсията в зависимост от адекватността на (3.28) може да се определи, както следва:

(3.29)

където - адекватността на сумата от квадратите;

- броят на степените на свобода на адекватността на дисперсията;

- броят на числото на коефициентите в сближаването на регресия уравнение (линеен случай);

- остатъчната сума от квадратите;

- сумата от квадратите свързани с дисперсията на възпроизводимост;

- броят на степените на свобода на остатъчната дисперсията;

- броят на степените на свобода на дисперсията на възпроизводимост.

Преглед на зависимости изчислени за вариациите прогнози в (3.28) зависи силно от порядъка на активното експеримента. следва да се разпределят след четири случая. Първият случай отговаря на условията на експеримента, когато извършва неравномерно брой повторения във всяка клетка на плана за матрица, а именно:

,

За тази цел най-общия случай на дисперсия адекватност може да се определя от отношенията:

(3.30)

където ;

;

Вторият случай отговаря на условията на експеримента, когато във всяка клетка на матрицата на планиране извършва равен брой паралелни експерименти, че е:

,

Това състояние значително опростява изчисленията, обаче, провеждане на активен експеримент, изследователят, като правило, тя е склонна да се приложи. В тези дисперсии условия оценка са на формата:

, (3.31)

Третият случай отговаря на условията, когато по някаква причина, не са проведени паралелни експерименти във всяка планиране матрица клетка. При тези условия, за да се определи дисперсията изчислява, е целесъобразно да се постави допълнителна серия от L-ти опит в центъра на експерименталния дизайн (когато входните фактори се изучава базови нива). В този случай,

(3.32)

където

- стойността на продукцията параметър в γ-ти експеримента за сърцевинния слой на входните фактори.

Можете да използвате таблица 3.3 за отчитане на различни експерименти дублиране опция в практическото решаване на проблеми.

Четвъртият случай отговаря на условията, когато паралелни експерименти не са проведени, както и допълнителен експеримент в центъра по някаква причина не може да се сложи на плановете. В този случай качеството на сближаване на експерименталните данни, получени от приблизително уравнението на регресия, може да бъде оценена чрез сравняване на остатъчната дисперсия Fisher критерий S 2 OST. и по отношение на средната стойност на S 2 у, т.е.

(3.33)

където е 1 = N - 1 - броят на степените на свобода спрямо дисперсионна среда S 2 у;

е 2 = N - Н - броят на степените на свобода на остатъчната дисперсията.


Таблица 3.3 - суми площади и броят на степените на свобода в различни експерименти изпълнения дублиране.

Източник на разпръскване Естеството на дублиращи експерименти сума от квадрати Броят на степените на свобода
експеримент грешка неравен
униформа
Копирно план една точка (например, J = 1)
Дублирането в отделна серия от експерименти L (например, в центъра на плана)
Неадекватността на модела неравен Ада е = NH
униформа Ада е = NH
Копирно план една точка (например, J = 1) Ада е = NH
Дублирането в отделна серия от L-ти експеримент (например, в центъра на плана) Ада е = NH


Така изчисляване вариацията оценка възпроизводимост възпроизвеждане S 2 S 2 и адекватност зависимост от ада (3.30), (3.31) или (3.32), изчислена от уравнението (3.28) изчислената стойност на F - тест и в сравнение с дадени в таблица Е. (Α, е 1, е 2), определен за ниво на значимост α и броят на степените на свобода е 1 е 2 на числителя и знаменателя в уравнение (3.28).

Ако състоянието

няма причина да се съмняват в адекватността на регресия уравнение, получени приблизителни резултатите от експеримента.

Ако, обаче,

следва да се заключи, недостатъчността на получения образец и се предприемат мерки за подобряване (например, за да изберете полином от по-висок ред, или да извърши нелинейни коефициенти на преобразуване) с цел накрая да се получи модел, който отразява адекватно свойствата на изследваната система.

При проверка на съответствието на приблизителното уравнение чрез регресионен връзка (3.33) трябва да се забравя, че безразмерна съотношението показва колко пъти намалени разсейване спрямо регресия уравнение получен в сравнение с относителното разсейване среда. Ето защо, колкото по-голяма от стойността на F изч. Получават с формула (3-33) ще надвишава таблица F маса. (Α, е 1, е 2), определен за ниво на значимост α и степни номера свобода е 1 - е 2 и числителя - знаменател във формула (3.33) по-ефективно ще бъде приблизително уравнение регресия.

След получаване на адекватна приблизителното уравнение регресия, се пристъпи към проверка на значимостта на оценки на регресионни коефициенти. Целта на този тест, както и при обработката на пасивни експерименти, е да се установи статистическата значимост или значимостта на регресионните коефициенти се различава от нула. В резултат на това ние се установи дали разликата се дължи на Б И от нула само на съвпадението ефект на шума ε (експериментален шум) или тази разлика не е случайно и се дължи на факта, че истинската регресионен модел, има съответен коефициент на регресия ,

Оценка на значимостта на коефициентите се извършва чрез т - тест:

(3.34)

където - оценка на стандартното отклонение на коефициента на б аз.


Както е отбелязано по-горе, активното (планирана) експеримент, всички коефициенти на регресия приблизително определят с еднаква точност. В случая, когато не паралелни експерименти, може да се определя от формулата:

, (3.35)

За различните условия на активното дисперсията оценяват възпроизводимостта на експеримента във формула (3.35) се изчислява от връзките (3.30), (3.31) или (3.32).

Значението на проверка се свежда до един последователен тест нулевата хипотеза H 0 и конкурентна хипотеза H 1:

За тази цел, т изчислената стойност - т и изчислено критерий за оценка i- та коефициент на регресия б и се сравнява с таблицата, критичната стойност на т маса. (Α, е), се приема за α ниво на значимост, а броят на степените на свобода е = F възпроизвеждане. Ако състоянието

т и калк. > Т таблица. (Α, е),

нулевата хипотеза H 0 е взета. В този случай, коефициентът б аз не Cchitaetsya статистически значими, и разликата му от нула е обяснено само от действието на чисто случайни обстоятелства. Ето защо. Този коефициент на приблизителното уравнение на регресията може да бъде изтрит при условие, че следователят нямаме допълнителни аргументи в полза на нейното опазване. Както бе споменато по-горе, тя не засяга останалите, затова няма нужда от допълнителни разпределения не трябва да се извършват в обработката на резултатите от дейността (планирана) изключване експеримент от регресионни уравнения на произволен брой незначителни коефициенти.

След изключването на всички незначителни коефициенти трябва отново да проверят адекватността на приблизителното уравнение регресия и, ако е тя да бъде подходяща, може да се пристъпи към нейното тълкуване.


Забележка. Понякога в хода на научни изследвания, има случаи, когато валидиране на полученото уравнение приблизителна регресия е невъзможно. Обикновено това се случва, когато N варианти вариант план polnofaktorny експеримент (PPE) е броят на изчислените коефициенти на регресия уравнение ревизираното. В този случай, в знаменателя при изчисляване на зависимости дисперсия за адекватността на нула градуса от свобода, и да се тества хипотезата за адекватността на математическия модел на останките на резултатите от експеримента.

При тези обстоятелства е препоръчително да се проверява първо значението на коефициенти на регресия на приблизителна, тъй като отхвърля незначително от тях, ще получите допълнителна степен на свобода за изпитване на адекватността. Ако всички оценките на коефициентите на регресия ще бъдат значителни, което е, условията ще бъдат изпълнени

N = H;

AD F = N - Н = 0,

в този случай, както изглежда, по-правилно ще намали интервалът на изменение на входните фактори и отново да проведе експеримент или да отидете директно на по-сложен модел от полином от по-висока степен.

3.3.3 Анализ на уравнението на регресия

Чрез статистически анализ и получаване на адекватна регресия уравнение приближение, се пристъпи към тълкуване. Интерпретация обикновено се разбира превод Получената математически модел (регресия уравнение) на езика на експериментатора. Задачата на тълкуване е доста сложен и разнообразен, но общите препоръки могат да бъдат обобщени по следния начин.

Първо, установяване на степента, до която всяка от входната система изследва фактори влияят параметър изход (оптимизация параметър). регресионен коефициент Module - количествена мярка за влияние. Естеството на въздействието на входните фактори, казват знаците на коефициентите на регресия. Знакът "+" показва, че увеличението на стойността на този фактор ще увеличи входа и на изхода стойност на параметър система; когато знакът "-" увеличаване на стойността на този фактор ще намали изходният параметър (оптимизация параметър).

След анализ на коефициентите на всички линейни ефекти. Преминете към тълкуването на коефициентите на двойки взаимодействия на фактори. Физическата взаимодействието между фактори означава, че промяната на продукцията параметър Y на различни нива на въвеждане фактор не е еднакъв за всички други входни нива на фактор. Символи двойка взаимодействия влияние върху изходния параметър на системата също се определя от знака на съответния коефициент на регресия.


Тук, ако знак "+", а след това едновременно увеличаване или намаляване на тези фактори води до увеличаване на продукцията на параметъра. За да намалите стойността необходимо да се промени и двата фактора в различни посоки.

Ако ефектът на взаимодействието има "-" знак, като увеличението или намалението фактори, причиняващи намаляването на продукцията параметър. За да се увеличи стойността е необходимо да се променят и двете от тези фактори в различни посоки.

Тълкуване на коефициентите на по-висш порядък в взаимодействията, обикновено не се извършва поради трудността за разбиране на тяхното физическо лице.

След интерпретацията на резултатите от симулацията са прехвърлени на приемането на по-нататъшни изследователски решения. Броят на възможните ситуации, е невъзможно да се изброят. Съсредоточете се само върху най-често срещаните.

1 Ако линейния модел е подходящ и коефициентите на регресия са значителни, можете или да завърши разследването или да продължат с оглед на подробно проучване на района на оптимума.

2 Ако линеен модел е подходящо, и повечето от коефициенти на регресия на уравнението не е от значение, след това можете да промените интервала различни фактори, или плевели от не-съществени фактори или увеличаване на броя на паралелни експерименти и ако областта е в близост до оптимума, е възможно да се завърши изследването.

Трябва да се подчертае, че промяната в интервал промяна води до промяна на коефициентите на регресия. Абсолютните стойности на коефициентите на регресия увеличава с увеличаването на интервали от време. Не само знаците на коефициентите се променят, обаче, и те могат да се обърнат, ако движението ние "пресече" екстремна точка.

3 Ако линейният модел е подходящ, както и всички коефициентите на регресионното уравнение не са значителни, с изключение на б 0, трябва или да се увеличи точността на експеримента, или да удължи интервалите на вариране. Ако зоната близо до оптимума, че е възможно да завърши проучването.

4 Ако линейният модел е недостатъчен, което означава, че не можете да се доближи до равнината на повърхността на отговора. В този случай, промяната (намаление) на различни интервали от време, друга точка е избран за базовия слой или с помощта на нелинеен модел. Ако зоната близо до оптимума, че е възможно да завърши проучването.

5 Специален случай възниква при използване на наситени планове. Когато значението на всички коефициенти (линейни и нелинейни) не мога да кажа нищо за адекватността на модела с неадекватността, тъй като в този случай, не е възможно да се изчисли на адекватността на дисперсията се дължи на факта, че броят на степените на свобода е равна на нула.

В този казус може да бъде завършена в близост района на оптимума, а в противен случай - да продължи.


При продължаване на проучвания за оценка на оптимално областта на най-разпространените методи са:

метод Зайдел "стръмно изкачване" Каре-Уилсън - Гаус. Вторият метод се предпочита, тъй като дава възможност да се намери оптимално регион за минималния брой експерименти.

След като завърши тълкуването на уравнението на регресия и да вземе решение за прекратяване на проучването, е препоръчително да се извърши обратен преход от х и кодирани фактори за природен променлива Z и (1). Миграцията може да се извърши чрез линейна трансформация на формата

където Z I - стойност на I - ти вход фактор в естествен мащаб;

Z и 0 - изходно аз-ти вход на природен фактор мащаб;

- вариант интервал аз-ти вход на природен фактор мащаб.

Следва да се отбележи, че след обратен преход заменя приблизителни величини и признаци на регресионно уравнение коефициентите и загубил интерпретация възможност фактори влияят от големината и знака на данните за коефициента. Въпреки това е възможно да се изучава поведението на изхода на параметъра в зависимост от физическите стойности на входните фактори без излишно експериментиране със системата под изследване.

Така че е необходимо, за да останете на още един важен въпрос, който е свързан с обработването на резултатите от активен експеримент провеждат на компютър или с помощта на математически модел на симулация на системата в процес на проучване.

Този проблем е в дефиницията на заключенията на реалната система, направени въз основа на модела на данни, или колко лесно могат да бъдат използвани изводите и резултатите.

От математическа или симулационен модел никога не е идентична с реалната система, а не предава всички свои качества и характеристики, както и получените в модела на анализ резултати, винаги са обект приблизителни. Тяхната точност се определя от степента на съответствие, адекватността на модела и обекта. Ето защо, като някои заключения и дава практически съвети, ние винаги трябва да се помни, че те със сигурност само в ограниченията, които се развиват в нашия математически (симулация) модел, а в интервалите на вариране на факторите на входната система, която се проведе компютри (симулация) експеримент.


Задача.

Оценка на характера и степента на влияние на грешки при определяне на балистични основни параметри - начална скорост на снаряда полет , Ъгълът хвърли , Балистични коефициент на отклонение на центъра на групата от снаряди от boresight в диапазон по време на изпичане на 152-мм 2C3 S1` на първия заряд, снаряда 540. Началните стойности на тест входни фактори и средната грешка на тяхното определяне, съгласно таблици диапазон превозно средство RG 153, съответно:

= 603 м / сек; Е [DV 0] = 0,23% V = 0 1.39 m / и;

= 45 градуса; д. [DQ 0] = 0.25, то = 0.015 ° С.

= 0,5232; Е [дС] = 0,72% С = 0,0038.

Проблемът с изследвания, за да се реши въз основа на компютърна симулация с помощта на математически модел на движение на центъра на тежестта на черупки артилерия. За тази цел, да планираме и осъществим ЛПС и обработва резултатите от множествена регресионен анализ.

решение

1 извършват дейности за предварително планиране етап от експеримента.

Според изследователския проблем, е необходимо да се направи оценка на последиците от грешки определение на три независими входни фактори , и параметъра изход - отклонение от централния групирането на снаряди boresight в диапазон , За тази цел, в началния етап на проучването ще се опита да сближи повърхност отговор е математически модел на формата:

, (3.36)

Следователно, всеки от моно входни фактори варира само две нива - горна и долна, и броя на експериментите е равно на N 8:

N = 8 = 2 месец март.

За да се определи възможността за възпроизвеждане на дисперсията ще проведе експерименти с три паралелни експерименти във всяка точка план. Ние планираме за центъра - основно ниво - приемам първоначалните стойности на изследваните фактори. Интервалът на изменение на входните фактори и да изберете четири равни средната грешка при определяне на тест входните фактори. Стойностите на тези параметри в естествено скалата са представени в Таблица 3.3.


Таблица 3.3 - Първоначална статистическа материал в естествена скала

нивата на фактор входните фактори
M / S , градушка C
Основно ниво 0.5232
вариация интервал 5560 0.06 0.0152
горното ниво 608,56 45.06 0.5384
по-ниско ниво 597,44 44.94 0.5080