Самолетни двигатели Административно право Административно право на Беларус Алгебра Архитектура Безопасност на живота Въведение в професията „психолог” Въведение в културната икономика Висша математика Геология Геоморфология Хидрология и хидрометрия Хидравлични системи и хидромашини История на Украйна Културология Културология Логика Маркетинг Машинен инженеринг Медицинска психология Метали и метални инструменти Заваряване икономика Описателни геометрия Основи на икономически т Oria професионална безопасност Пожарна тактика процесите и структурите на мислех Професионална психология Психология Психология на управлението на съвременната фундаментални и приложни изследвания в апаратура Социална психология социални и философски проблеми Социология Статистика теоретичните основи на компютъра автоматично управление теория теорията на вероятностите транспорт Закон Turoperator Наказателно право Наказателно-процесуалния управление модерно производство Физика физични явления Философски хладилни агрегати и екология Икономика История на икономиката Основи на икономиката Икономика на предприятията Икономическа история Икономическа теория Икономически анализ Развитие на икономиката на ЕС Спешни ситуации VKontakte Odnoklassniki My World Facebook LiveJournal Instagram

Показатели за корелационна плътност за многовариантния модел на корелация-регресия




Стегнатостта на връзката между изследваните показатели с множествена корелация се определя на базата на различни коефициенти. За да може регресионното уравнение да отразява адекватно (приблизително) реалните симулирани социално-икономически процеси или явления, трябва да бъдат изпълнени условията и изискванията за множествен корелационно-регресионен анализ.

Корелация - регресионен анализ : аналитичен израз на уравнената (праволинейна, криволинейна) регресия за многофакторния модел на корелация и регресия. Определяне на параметри и тяхната интерпретация.

Стегнатостта на връзката между тях се измерва чрез съотношението на факторна дисперсия към общата дисперсия на резултиращия атрибут, наречен индекс на определяне. Индексът на определяне характеризира дела на изменението на продуктивния признак под влияние на факторната черта в общата променливост на продуктивния признак. Ако има зависимост между знаците, тогава тъй като той се засилва, т.е. увеличавайки стегнатостта на връзката между продуктивните и факторните признаци, индексът на определяне се увеличава и намалява, докато отслабва. По този начин индексът на определяне характеризира стегнатостта на връзката, близостта на корелацията с функционалното.

Квадратният корен на индекса на определяне е индексът на корелация или теоретичното съотношение на корелацията . Индексът на корелация или теоретичното съотношение на корелация характеризира стегнатостта на връзката за всяка форма на зависимост. Остатъчна дисперсия необходимо да се избере най-добрата функция, която в най-голяма степен подравнява (приблизително) емпиричната регресионна линия. Приблизителната функция се избира от минималната остатъчна дисперсия s 2 ost = S (y t - ) 2 / n или ,

Конкретен случай на индекса на корелация е линеен коефициент на корелация r , който се използва за оценка на стегнатостта на връзката с линейна връзка. Коефициентът на корелация приема стойности от -1 до +1, показва не само пренаселеност, но и посоката на комуникация. Знакът "+" показва пряка връзка между продуктивните и фактологичните знаци, знакът "-" показва обратна връзка между тях. Ако r = 0, няма връзка между знаците. Колкото по-близо е r до единството, толкова по-близка е връзката между разглежданите характеристики.

При линейната форма на комуникация параметърът на уравнението на права линия е коефициентът на регресия a 1 и коефициентът на корелация r са свързани помежду си, както следва:

и 1 = rs y / s x . При пряка връзка коефициентът на линейна корелация е идентичен с индекса на корелацията, те са числено равни на: ,

Коефициентът на линейна корелация r се използва за оценка на херметичността на връзката с линейна връзка: директно уравнение = a 0 + a 1 x


border=0


За да опростите изчисленията на коефициента на линейна корелация, използвайте преобразуваната формула: ,

Естеството на връзката се определя от стойността на коефициента на корелация :

R коефициент на корелация характер на общуване
r = 0 за 0.3 практически отсъства
0 <r <1 0,3 - 0.5 + директен беден
-1 <r <0 0,5 - 0.7 - заден ход умерено
r = 1 0,7 - 1,0 1 - функционален силен

Значимостта на коефициента на линейна корелация се определя от критерия t - ученик. Определя се изчислената стойност на t изчислението , която се сравнява с табличната стойност на t крит . Коефициентът на линейна корелация се счита за значителен, ако се наблюдава връзката: t изчисление > t критерий .

при n за n <50.

t крит . се определя от таблицата "Стойността на критерия t - ученик на ниво на значимост 0,10, 0,05, 0,01 и степен на свобода ,

Задачата на мултивариантната корелация - регресионен анализ е, първо, да се проучат редица фактори, влияещи върху изследвания индикатор и избора на най-значимите; второ, при определяне на степента на влияние на всеки фактор върху ефективен знак чрез изграждане на модел - уравнението на множествената регресия, което ви позволява да установите в коя посока и по каква стойност ефективният индикатор ще се промени, когато всеки фактор в модела се промени; трето, в количествената оценка на стегнатостта на връзката между ефективния атрибут и фактор.

Математически проблемът е да се намери аналитичен израз на функция = f (x 1 , x 2 , x 3 , ..., x n ), което по най-добрия начин отразява връзката на факторните атрибути с ефективния. Резултатите от теоретичния анализ и възможността за приложението им на практика зависят от правилния избор на регресионната функция, следователно формата на комуникация трябва по най-добрия начин да съответства на реалните връзки между резултиращия атрибут и факторните. Трудността при избора на функция е, че ефективен атрибут с различни фактори може да бъде в различни форми на комуникация - права и извита. Емпиричната обосновка на типа функция с използване на графики на сдвоени отношения е практически неподходяща за многократна корелация и регресия.



Изборът на формата на уравнението с множествена регресия се основава на теоретичен анализ на изследваното явление. Ако анализът на връзката между продуктивните и факторните атрибути не ни позволява да се спрем на каквато и да е форма на комуникация, тогава сортираме различни функции и избираме оптималната от гледна точка на близостта на емпиричните стойности на резултиращия атрибут до равни, но това е свързано със значителната сложност на изчисляване на параметрите на различни уравнения. Ако има специален софтуер, който реализира алгоритъм за изброяване на различни уравнения на множествена регресия на компютър, се получават няколко модела, най-добрият се избира чрез статистическа проверка на параметрите на уравнението въз основа на t- тест на Студент и Fisher F-тест .

Изборът на формата на уравнението с множествена регресия се осъществява на практика

въз основа на използването на пет типа модели :

линеен a 0 + a 1 x 1 + a 2 x 2 + ... + a n x n ;

на захранване ;

показателен ;

параболичен

хиперболичен

Най- често се спират на линейни модели. Това се дължи на факта, че, първо, параметрите на линейни уравнения се интерпретират лесно, самите модели са прости и удобни за икономически анализ, и второ, ако желаете, всяка функция може да бъде намалена до линейна форма чрез логаритмиране или замяна на променливи.

В уравнението на множествена регресия в линейна форма параметрите 1 , 2 , 3 , ..., и n са коефициентите на регресия, показват степента на влияние на съответните фактори върху ефективния знак, когато останалите фактори са фиксирани на средно ниво, т.е. колко ще се промени с увеличение на съответния коефициент с 1 точка в единицата си на промяна; параметърът 0 е свободен термин, той няма икономически смисъл.

Параметрите на уравнението с множествена регресия , подобно на двойката първа, се изчисляват по метода на най-малките квадрати въз основа на решението на система от нормални уравнения. Тъй като коефициентите на регресия не са сравними един с друг (факторите имат различни измервателни единици), е невъзможно да се сравни силата на влиянието на всеки от факторите, включени в модела, върху ефективния знак, базиран на коефициентите на регресия. За да се оцени сравнителната сила на влиянието на факторите, се изчисляват коефициентите на частичната еластичност и b-коефициентите.

Частичният коефициент на еластичност показва колко процента средно ще се промени ефективният индикатор, когато коефициентът се промени с 1%, а останалите фактори са фиксирани и се изчисляват отделно за всеки фактор:

, където a i е коефициентът на регресия при i-тия фактор; - средната стойност на i-тия фактор; - средната стойност на ефективния индикатор.

B-коефициентът показва колко от стандартното отклонение се променя резултиращият атрибут, когато съответният коефициент се променя със стойността на средното му квадратно отклонение , където s xi , s y са средните квадратни отклонения на i-тия фактор и резултиращият атрибут.

Поради факта, че икономическите явления се влияят от многобройни и сложни причини, значителните, систематично действащи фактори трябва да бъдат включени в уравнението на множествена регресия при елиминиране на влиянието на други фактори. Най-важните фактори се избират въз основа на анализа на стегнатостта и съществеността на връзката между факторите и ефективния показател. Освен това, условието за включване на фактори в модела е липсата на много тясна зависимост между тях, близка до функционалната. Наличието между двата фактора на много тясна линейна връзка (коефициентът на линейна корелация r надвишава абсолютната стойност на 0,85) се нарича колинеарност , а между няколко фактора - мултиколинеарност .

Причините за появата на мултиколинеарност между характеристиките са на първо място, че анализираните характеристики характеризират една и съща страна на явлението или процеса (например, уставният капитал и броят на служителите характеризират размера на предприятието) и не е препоръчително те да се включват в модела едновременно; второ, факторните знаци са компоненти помежду си, дублират се взаимно или общата им стойност дава постоянна стойност (например съотношението на енергия и капитала, съотношението на заетите и собствените средства). Ако в модела са включени мултиколинеарни фактори, тогава уравнението на регресия ще отразява неадекватно реалните икономически връзки, параметрите на модела ще бъдат изкривени (надценени), значението ще бъде променено и икономическата интерпретация на коефициентите на регресия и корелация ще бъде трудна.

Следователно при конструирането на модел един от колинеарните фактори се изключва въз основа на качествен и логически анализ или първоначалните факторни признаци се трансформират в нови, разширени. Качеството и адекватността на модела към реалното социално-икономическо явление и процес се определят от оптималността на броя на факторните атрибути: колкото повече фактори са включени, моделът описва явлението и процеса по-добре, но такъв модел е трудно приложим; с малък брой фактори, моделът не е достатъчно адекватен.

Проблемът с избора на факторни характеристики и намаляване на измерението на модела за множествена корелация се решава на базата на евристични и многоизмерни методи за анализ. Евристичните методи за анализ включват метода на експертни оценки, базиран на интуитивно-логически предпоставки и смислен и качествен анализ на непараметрични показатели за комуникационна плътност: коефициенти на корелация на ранг, съгласуваност. Най-често използваният метод е поетапната регресия , която се състои в последователно включване на фактори в модела и оценка на тяхната значимост.

При въвеждането на коефициента се определя колко намалява сумата на квадратните остатъци и стойността на множествения коефициент на корелация R. Ако, когато коефициентът x k е включен в модела, стойността на R се увеличава и коефициентът на регресия a k не се променя или не се променя значително, тогава този фактор е значителен и неговото включване в модела е необходимо.

· Съвкупността от изследваните показатели трябва да бъде хомогенна според условията за формиране на ефективни и факторни признаци (отличителните наблюдения трябва да бъдат изключени от съвкупността);

· Ефективният знак трябва да се подчинява на нормалния закон за разпределение, фактор - трябва да е близък до нормалното разпределение. Ако обемът на населението е достатъчно голям (n> 50), тогава нормалността на разпределението може да бъде потвърдена чрез изчисляване и анализ на критериите на Пиърсън, Ястремски, Колмогоров, Боярски и др .;

· Симулираният феномен или процес се описва количествено (параметрите трябва да бъдат изразени цифрово) с едно или повече уравнения на причинно-следствените връзки. Препоръчително е да се опишат причинно-следствените връзки като линейни или близки до линейни зависимости на формата;

· Постоянството на териториалната и временната структура на изследваното население, липсата на количествени ограничения върху параметрите на модела;

· Достатъчност на агрегатните единици : техният брой трябва да бъде няколко пъти по-голям от броя на факторите, включени в модела. Всеки фактор трябва да има най-малко 5–6 наблюдения, т.е. броят на факторните признаци трябва да бъде 5-6 пъти по-малък от обема на изследваната популация.

Основните етапи на корелационния и регресионен анализ са:

· Предварителен теоретичен анализ на същността на явлението, позволяващ да се установят причинно-следствените връзки между знаците, да се изберат най-важните фактори, да се реши проблемът с измерването на ефективните и факторните признаци;

· Подготовка на изходна информация , включително въпроси за адекватността на мерните единици за наблюдение, за еднаквостта на съвкупността на изследваните характеристики и близостта на тяхното разпространение до нормалното;

· Изборът на форма на комуникация между ефективния атрибут и факторите въз основа на изброяването на няколко аналитични функции;

· Изследване на стегнатостта на връзката между продуктивната характеристика и факторите, както и между факторите, основаващи се на изграждането на матрица от сдвоени линейни коефициенти на корелация и скрининг на мултиколинеарни фактори;

· Избор на значими (значими) фактори, включени в многомерния модел - уравнението на множествената регресия, основаващо се на съответните статистически методи;

· Изчисляване на параметрите на уравнението на множествена регресия и оценка на значимостта на избраните фактори, коефициентите на корелация и регресия, използвайки критериите t - Стьюдент и F - Фишър ;

· Анализ на резултатите.

Връзките между знаците се анализират като правило въз основа на пробни наблюдения, следователно, за да се провери дали получените зависимости са редовни, а не случайни, се оценява значимостта (значимостта) на показателите за корелация и регресия.

Корелация - регресионният анализ се използва за оценка на показатели на бизнес план и стандартни нива на икономически показатели, отразяващи ефективността на използване на производствените ресурси, идентифициране на наличните производствени резерви, провеждане на сравнителен анализ, оценка на потенциала на предприятията и краткосрочно прогнозиране на развитието на производството.

Уравнението с множествена регресия ви позволява да намерите теоретичната, възможна стойност на ефективния индикатор за определени стойности на факторните атрибути.

Параметрите на уравнението с множествена регресия се изчисляват по метода на най-малките квадрати въз основа на решението на система от нормални уравнения. За линейно регресионно уравнение с n фактори се изгражда система от (n + 1) нормални уравнения:

a 0 n + a 1 Sx 1 + a 2 Sx 2 + ... + a n Sx n = Sy,

a 0 Sx 1 + a 1 Sx 2 1 + a 2 Sx 1 x 2 + ... + a n Sx 1 x n = Syx 1 ,

:

a 0 Sx n + a 1 Sx 1 x n + a 2 Sx 2 x n + ... + a n Sx 2 n = Syx n .

Стегнатостта на връзката между изследваните показатели с множествена корелация се определя на базата на различни коефициенти.

Сдвоените коефициенти на корелация r измерват плътността на линейната връзка между факторите и между продуктивния атрибут и всеки от разглежданите фактори, без да се отчита тяхното взаимодействие с други фактори

Частичните коефициенти на корелация характеризират степента на влияние на факторите върху продуктивния признак, при условие че други фактори са фиксирани на постоянно ниво. В зависимост от броя на факторите, чието влияние е изключено, коефициентите на частичната корелация могат да бъдат от първи ред (при изключване на влиянието на един фактор), втори ред (при изключване на влиянието на два фактора) и т.н.

Коефициентът на частична корелация от първи ред между y и x 1 с изключване на влиянието на x 2 в двуфакторния модел се изчислява по формулата: ,

където r yx 1 , r yx 2 , r x1x2 са сдвоени коефициенти на корелация между съответните характеристики.

Съвкупният коефициент на множествена корелация R оценява стегнатостта на връзката между ефективния атрибут и всички фактори. Това е основният показател за линейна множествена корелация. За двуфакторния модел общият коефициент на множествена корелация се изчислява по формулата:

, Коефициентът на съвкупност на корелацията R варира от 0 до 1. Колкото по-малки са емпиричните стойности на резултиращия атрибут, които се различават от тези, подравнени по линията на множествена регресия, толкова по-близка е корелацията между изследваните параметри и по-близо до единица е съвкупният коефициент на множествена корелация.

Обобщеният коефициент на множествено определяне , равен на R 2 , показва коя част от изменението на ефективната характеристика се дължи на влиянието на факторите, включени в модела.

Обобщеният индекс на множествена корелация характеризира стегнатостта на връзката между ефективния атрибут и всички фактори с криволинейна зависимост:

= където - отклонение на ефективния атрибут под влияние на фактори, включени в модела; - остатъчна дисперсия на ефективния атрибут, причинена от влиянието на фактори, които не са взети предвид от модела. При линейната форма на комуникация коефициентът на съвкупност и коефициентът на множествена корелация са равни.

Значимостта на коефициента на множествена корелация R се определя от теста на F - Fisher. Определя се изчислената стойност на изчислението F, която се сравнява със стойността на таблицата на F крита . Коэффициент множественной корреляции считается значимым при соблюдении соотношения: F расч > F крит .

или ,