КАТЕГОРИЯ:


Астрономия- (809) Биология- (7483) Биотехнологии- (1457) Военное дело- (14632) Высокие технологии- (1363) География- (913) Геология- (1438) Государство- (451) Демография- (1065) Дом- (47672) Журналистика и СМИ- (912) Изобретательство- (14524) Иностранные языки- (4268) Информатика- (17799) Искусство- (1338) История- (13644) Компьютеры- (11121) Косметика- (55) Кулинария- (373) Культура- (8427) Лингвистика- (374) Литература- (1642) Маркетинг- (23702) Математика- (16968) Машиностроение- (1700) Медицина- (12668) Менеджмент- (24684) Механика- (15423) Науковедение- (506) Образование- (11852) Охрана труда- (3308) Педагогика- (5571) Полиграфия- (1312) Политика- (7869) Право- (5454) Приборостроение- (1369) Программирование- (2801) Производство- (97182) Промышленность- (8706) Психология- (18388) Религия- (3217) Связь- (10668) Сельское хозяйство- (299) Социология- (6455) Спорт- (42831) Строительство- (4793) Торговля- (5050) Транспорт- (2929) Туризм- (1568) Физика- (3942) Философия- (17015) Финансы- (26596) Химия- (22929) Экология- (12095) Экономика- (9961) Электроника- (8441) Электротехника- (4623) Энергетика- (12629) Юриспруденция- (1492) Ядерная техника- (1748) Arhitektura- (3434) Astronomiya- (809) Biologiya- (7483) Biotehnologii- (1457) Военни бизнесмен (14632) Висока technologies- (1363) Geografiya- (913) Geologiya- (1438) на държавата (451) Demografiya- ( 1065) Къща- (47672) журналистика и смирен (912) Izobretatelstvo- (14524) външен >(4268) Informatika- (17799) Iskusstvo- (1338) историята е (13644) Компютри- (11,121) Kosmetika- (55) Kulinariya- (373) културата е (8427) Lingvistika- (374) Literatura- (1642) маркетинг-(23702) математиците на (16968) Механична инженерно (1700) медицина-(12668) Management- (24684) Mehanika- (15423) Naukovedenie- (506) образователна (11852) truda- сигурност (3308) Pedagogika- (5571) Poligrafiya- (1312) Politika- (7869) Лево- (5454) Priborostroenie- (1369) Programmirovanie- (2801) производствено (97 182 ) индустрия- (8706) Psihologiya- (18388) Religiya- (3217) Svyaz (10668) Agriculture- (299) Sotsiologiya- (6455) на (42831) спортист строително (4793) Torgovlya- (5050) транспорт ( 2929) Turizm- (1568) физик (3942) Filosofiya- (17015) Finansy- (26596) химия (22929) Ekologiya- (12095) Ekonomika- (9961) Electronics- (8441) Elektrotehnika- (4623) Мощност инженерно ( 12629) Yurisprudentsiya- (1492) ядрена technics- (1748)

Линеен регресионен модел и корелация на двойката

Помислете за най-простият модел парна регресия - линейна регресия. Линеен регресионен се използва широко в иконометрията, защото на ясна икономическа интерпретация на параметрите му.

Линеен регресионен се свежда до намиране на уравнението на формата

или , (1.1)

Уравнението на формата То дава възможност за определяне на стойността на коефициента намерите теоретичните стойности на получената променлива, замествайки в това действителната стойност на коефициента ,

Изграждане на линейна регресия е намалена с оценката на неговите параметри - и , Класическият подход за оценка на параметрите на линейна регресия на базата на метода на най-малките квадрати (OLS). OLS позволява да получат такива параметри за оценка и При което сумата от квадратите на отклонения на действителните стойности на Получената променлива на теоретичната минималната:

, (1.2)

Т.е. сред множеството линии на регресия на графиката е избран така, че сумата от квадратите на разстояния между точки на вертикалната линия, и това ще бъде минимална (фигура 1.2.):

Фиг. 1.2. Линията на регресия с минималните остатъци дисперсията.

Както е известно от хода на математически анализ да намерите минимум на функцията (1.2), е необходимо да се изчисли частични производни по отношение на всеки от параметрите и и ги приравняват на нула. нека през , Тогава:

,

(1.3)

След прости преобразувания, получаваме следната система от линейни уравнения за оценка на параметрите и :

(1.4)

Решаване на система от уравнения (1.4), ние намерите точните оценки на параметрите и , Можете да използвате следните готови формули, които следват пряко от решението на системата (1.4):

, , (1.5)

където - Признаци на ковариация и , - Дисперсия характеристика и

, , , ,

Ковариация - числова характеристика на съвместното разпределение на две случайни величини, равни на очакването на продукта на отклонения на случайни величини от техните математически очаквания. Дисперсия - характеристика на случайна променлива, дефинирана като математическо очакване на квадрата на отклонението на случайна променлива от очакването. Очакването - сумата от продукти на случайни променливи стойности на съответните вероятности [1].

параметър Тя се нарича коефициент на регресия. Неговата стойност показва средната стойност на промяната в резултата с фактор на промяна с една единица.

Възможност за ясна икономическа интерпретация на линеен коефициент на регресия на уравнението на регресия е направил доста често при иконометричните изследвания.

официално - стойност при , Ако знак-фактор Тя не може да бъде нула, лечението на по-горе Безплатен участник няма смисъл, т.е., параметър не може да има икономически вещество.

Уравнението на регресия е винаги допълва от индикатор за близостта на връзката. При използване на линейна регресия като индикатор на такива актове коефициент на линейна корелация Което може да се изчисли с помощта на следните формули:



, (1.6)

Коефициентът на линейна корелация е в границите: , Колкото по-близо абсолютната стойност за единство, по-силен е линейна връзка между факторите (за Имаме строга функционална връзка). Но трябва да се разбере, че близостта на линеен абсолютната стойност на коефициента на корелация на нула, не означава, че няма връзка между характеристиките. В другия (нелинейна) модел спецификация връзката между знаците може да бъде доста близо.

За да се оцени качеството на подбора на линейна функция се изчислява квадрат на коефициента на линейна корелация Тя се нарича коефициент на характер. Коефициентът на определяне характеризира делът на получената променлива дисперсия , Обяснената регресия в общото разсейване ефективни характеристики:

, (1.7)

където , ,

Следователно, стойността на Тя характеризира дисперсията на акция Причинява се от влиянието на други, не са взети предвид в модела, фактори.

След резултатите от линейна регресия уравнение, за оценка на значимостта на уравненията като цяло и отделните му параметри.

Проверете значението на уравнението на регресия - означава да се определи дали един математически модел, който изразява връзката между променливите, експериментални данни, и ако има достатъчно включени в уравнението на обяснителни променливи (един или повече), за да се опише зависимата променлива.

За да имате обща преценка за качеството на модела на относителните отклонения на всяко наблюдение, определяне на средната грешка сближаване:

, (1.8)

Средната грешка сближаване не трябва да надвишава 8-10%.

Оценка на значението на регресионно уравнение като цяло се основава на Fisher-тест, което се предхожда от анализ на вариацията. В математически статистически анализ на вариацията се счита като независим инструмент за статистически анализ. В иконометрия се използва като помощно средство за изследване на качеството на модела на регресия.

Според основната идея на дисперсионен анализ, общата сума на квадратите на отклоненията на променливата от средната стойност разделят на две части - "обясни" и "необяснима":

,

където - Най-общо сумата от квадратите на отклоненията; - Сумата от квадратите на отклоненията, обяснения на регресия (или факторен сума от квадратите на отклонения); - Остатъчната сума от квадратите на отклоненията, характеризиращи влиянието на фактори, които не отчитат в модела.

Схема дисперсионен анализ има формата, показан в Таблица 1.1 ( - Броят на наблюденията, - Броят на параметрите в променливата ).

Таблица 1.1

вариацията Компоненти Сбор от квадрати Броят на степените на свобода Различията в една степен на свобода
цялостен
факториел
остатъчен

Определяне на дисперсията на дисперсия степен на свобода води до сравними вид. Сравнявайки фактор и остатъчната дисперсия на степен на свобода, ние получаваме стойност Fisher-тест:

, (1.9)

действителната стойност Fisher-тест (1.9) в сравнение с таблична стойност ниво на значимост и степените на свобода и , Така, ако действителната стойност по-тест на маса, тя признава, статистическата значимост на уравнението напълно.

За Simple линейна регресия така

, (1.10)

стойност -тест е свързана с коефициента на определяне И може да се изчисли по следната формула:

, (1.11)

Обикновено на линейна регресия оценява значение не само от уравнението като цяло, но също така и някои от неговите параметри. За тази цел, всеки параметър се определя от неговата стандартна грешка: и ,

Стандартната грешка на коефициента на регресия се определя от формулата:

(1.12)

където - Остатъчна дисперсия на степен на свобода.

Размер, заедно със стандартната грешка T-разпределение на Стюдънт с степени на свобода се използва за тестване на значението на коефициента на регресия и да изчисли своя доверителен интервал.

За да се оцени значението на коефициент на регресия, неговата стойност се сравнява със стандартната грешка, т.е. Тя се определя от действителната стойност Student-тест: които след това се сравнява с таблична стойност на определено ниво на значимост и броят на степените на свобода , доверителния интервал, за коефициента на регресия се определя като , В знак на коефициент на регресия показва увеличаване на ефективното знак функция чрез увеличаване фактор ( ), Намалява с увеличаване на ефективната характерна черта фактор ( ) Или независимостта на независимата променлива ( ) (Вж. Фиг. 1.3), доверителните граници на коефициента на регресия не трябва да съдържат противоречиви резултати, например, , Такъв запис показва, че истинската стойност на коефициента на регресия съдържа както положителни, така и отрицателни стойности и дори нула, което е невъзможно.

Фиг. 1.3. Наклонът на линията на регресия, в зависимост от стойността на ,

Стандартна грешка параметър определя по формулата:

, (1.13)

Процедурата за оценка на значимостта на този параметър не е различна от тази обсъдено по-горе за коефициент на регресия. изчислява -тест: , Неговата стойност се сравнява с таблична стойност на степени на свобода.

Значението на коефициента на линейна зависимост се изпитва на базата на стойността на грешка на коефициента на корелация :

, (1.14)

действителната стойност Студентски тест се определя като ,

Има връзка между -тест и Student Fisher-тест:

, (1.15)

Предсказаната изчисленията на регресионното уравнение се определят от прогнозирани стойност, както и прогноза за точка при Т.е. чрез заместване в уравнението на регресия съответните стойности , Въпреки това, прогнозата за точка очевидно не е реалистично. Поради това се допълва от изчисляването на стандартната грешка Т.е. И съответно интервала прогнозира стойности :

,

където и - Средна грешка на прогнозата на отделни стойности:

, (1.16)

3. Помислете за пример. Според проучване, проведено от осемте групи от семейства известни комуникации на данни разходите на домакинствата за храна до нивото на доходите на семейството.

Таблица 1.2

Разходите за храна, , Ths. Rub. 0.9 1.2 1.8 2.2 2.6 2.9 3.3 3.8
доходите на семейството , Ths. Rub. 1.2 3.1 5.3 7.4 9.6 11.8 14.5 18.7

Да приемем, че връзката между доходите на семейството и на разходите за храна е линейна. За да се потвърди нашата хипотеза ние конструираме областта на съответствието.

Фиг. 1.4.

Графиката показва, че точките са подредени в определен права линия.

За удобство на по-нататъшни изчисления грим маса.

Таблица 1.3

,%
1.2 0.9 1.08 1.44 0.81 1038 -0.138 0.0190 15.33
3.1 1.2 3.72 9.61 1.44 1357 -0.157 0.0246 13.08
5.3 1.8 9.54 28.09 3.24 1,726 0074 0.0055 4.11
7.4 2.2 16.28 54.76 4.84 2079 0,121 0.0146 5.50
9.6 2.6 24.96 92.16 6.76 2449 0.151 0.0228 5.81
11.8 2.9 34.22 139,24 8.41 2818 0.082 0.0067 2.83
14.5 3.3 47.85 210,25 10.89 3272 0028 0.0008 0.85
18.7 3.8 71.06 349,69 14.44 3978 -0.178 0.0317 4.68
общо 71.6 18.7 208,71 885,24 50.83 18.717 -0.017 0.1257 52.19
среден 8.95 2.34 26.09 110.66 6.35 2.34 - 0.0157 6.52
5.53 0.935 - - - - - - -
30.56 0874 - - - - - - -

Ние изчисляване на параметрите на линейна регресия уравнение на двойката , За това ние използваме формулата (1.5):

;

,

Получават уравнението: , Т.е. с увеличаване на доходите на семейството за 1000 рубли. разходите за храна се увеличава с 168 рубли.

Както бе споменато по-горе, уравнението на линейната регресия винаги допълва индикатор близостта на връзката - линеен коефициент на корелация :

,

Близостта на коефициента на корелация на 1 показва близък линейна връзка между функциите.

Коефициентът на определяне (Приблизително същия резултат се получава, ако ние използваме формулата (1.7)) показва, че уравнението на регресия обясни 98,7% от ефективно функцията на вариацията, но само 1,3% отчитат други фактори.

Ние оценявате качеството на уравнението на регресия като цяло с помощта на Fisher-тест. Разчитаме на действителната стойност -тест:

,

Таблични стойности ( , , ): , тъй като След призната статистическата значимост на уравнението напълно.

За да се оцени статистическата значимост на регресионните коефициенти и корелация Изчисли Студентски -тест и доверителни интервали за всеки от показателите. Ние изчисляваме случайната грешка на линейни параметрите на регресията и коефициента на корелация :

,

,

,

Реалните стойности -Statistics: , , , таблична стойност Student-тест при и броят на степените на свобода е , тъй като , и Тогава ние признаваме, статистическата значимост на параметрите на регресията и близостта на индикатора за връзка. Ние се изчисли доверителните интервали за параметрите на регресия и : и , Ние откриваме, че и ,

Средната грешка на сближаване (намерите използвайки таблица 1.3 на колоната 10; ) Това предполага добро качество на уравнението на регресия, т.е. Тя показва, добър избор на модела към първоначалните данни.

И, накрая, ние откриваме, че прогнозната стойност на продуктивен фактор в стойността на функцията-коефициент, равен на 110% от средното Т.е. намерите разходите за храна, ако размерът на доходите на семейството за 9850. трия.

(хил. рубли).

Така че, ако размерът на доходите на семейството за 9.845 THS. Rub., Разходите за храна ще бъдат 2490 хил. Rub.

Намираме доверителен интервал на прогнозата. прогноза за грешка

,

и CI ( ):

,

Т.е. прогноза е статистически достоверна.

Сега, на една и съща графика изобразяват суровите данни и линията на регресия:

Фиг. 1.5.

Тестови въпроси за самоконтрол

1. Най-очевидният вид избор е регресия уравнение на двойката:

а) анализ;

б) графика;

в) Pilot (маса).

2. Очаквайте двойката на линейна регресия параметри могат да бъдат, ако имаме:

а) най-малко 5 наблюдения;

б) не по-малко от 7 случая;

в) най-малко 10 наблюдения.

3. Метод на най-малките квадрати е:

а) минимизиране на количеството на остатъчни стойности;

б) да се сведе до минимум разпространението на получената променлива;

в) минимизиране на сумата от квадратите на остатъците.

4. Коефициентът на линейна регресия уравнение на двойката:

а) показва резултата със средната промяна в коефициента на промяна с една единица;

б) оценяват статистическата значимост на уравнението на регресия;

в) показва процентното изменение на средния резултат, ако фактор се променя до 1%.

<== Предишна лекция | На следващата лекция ==>
| Линеен регресионен модел и корелация на двойката

; Дата: 05.01.2014; ; Прегледи: 1174; Нарушаването на авторските права? ;


Ние ценим Вашето мнение! Беше ли полезна публикуван материал? Да | не



ТЪРСЕНЕ:


Вижте също:



ailback.ru - Edu Doc (2013 - 2017) на година. Тя не е автор на материали, и дава на студентите с безплатно образование и използва! Най-новото допълнение , Al IP: 11.45.9.24
Page генерирана за 0.06 секунди.