Ако функционалната връзка е лесна за откриване и измерване на единични и групови обекти, това не може да бъде открито с корелационни връзки, които могат да бъдат изучавани само върху групови обекти, използвайки методи на математическата статистика .

Задачите на корелационния анализ се свеждат до:

1) да се установи посоката и вида на връзката между различните знаци;

2) измерване на силата на корелацията;

3) валидиране на показателите за съответствие на извадката.

Корелационният анализ се използва широко в работата на лекар от всяка специалност: при оценка на физическото развитие на децата и юношите, за определяне на връзката между условията на труд, живота и здравето; при определяне на зависимостта на честотата на заболеваемост от пол, възраст, стаж и т.н.

Възможно е да се измери и оцени статистическата надеждност на корелационната връзка, като се използва коефициентът на корелация (r xy ) и нейната средна грешка (µ r ) .

Коефициентът на корелация (r xy ) позволява да се характеризира силата на връзката между изследваните явления и дава представа за нейната посока.

Корелацията между знаците е пряка (положителна) и обратна (отрицателна), праволинейна и криволинейна .

При директна връзка с увеличаване на стойностите на един атрибут, средната стойност на друг атрибут се увеличава. Коефициентът на корелация, който определя пряката връзка, се обозначава със знак плюс (+).

При обратна връзка с увеличение на един атрибут средната стойност на другия намалява. Коефициентът на корелация, характеризиращ обратната връзка, се обозначава със знака (-).



Според силата на връзката стойността на коефициента на корелация варира от единство (пълно свързване) до нула (липса на свързване) . Колкото повече средната стойност на един атрибут съответства на стойностите на друг атрибут, толкова по-висока е силата на връзката между тях.

Правата връзка се характеризира с относително еднаква промяна в средните стойности на един атрибут с равни изменения в другия.

В случай на криволинейна зависимост - с еднаква промяна в една характеристика, могат да се наблюдават увеличаване и намаляване на средните стойности на друга характеристика.

Измерването и оценката на връзката между явленията в случай на праволинейна корелация се извършва, като се използва коефициентът на корелация (r xy ) , а в случай на криволинейна корелационна връзка η .

Коефициентът на корелация показва само посоката и силата на връзката между две променливи, но не дава възможност да се прецени как количествено се променя стойността на едната като стойностите на другия атрибут. Отговорът на този въпрос се дава чрез прилагането на метода на регресия .

2. Изчисляване на коефициента на параметрична корелация по квадратен метод (Pearson), коефициент на параметрична корелация по метода на ранг (Spearman). Определяне на надеждността на коефициента на корелация

Степента на зависимост на случайни променливи x i и y i се характеризира със стойността на коефициента на корелация.

Параметричният коефициент на корелация на Пиърсън се използва за оценка на връзката между количествените атрибути, които се подчиняват на нормалния закон за честотно разпределение. Приема се нулевата хипотеза (H 0 ) , която заявява, че характеристиките, представени в различни проби, са независими една от друга , а коефициентът на корелация е близо до нула. И алтернативната хипотеза (H 1 ) предполага наличието на връзка между разглежданите характеристики, а величината на коефициента на корелация показва силата на съществуващата връзка .

За да проверите надеждността на хипотезата Н 0 , след като намерите стойността на коефициента на корелация (r xy ), използвайте специалната таблица на най-големите (критични) стойности на коефициента на корелация (r cr ), в която за дадено ниво на значимост α (0,01; 0,05) и известно число степени на свобода n '= n - 2 представя максималните стойности, които стойността на коефициента на корелация може да има, ако нулевата хипотеза е вярна. Ако намереното r xy <r cr , тогава наблюдаваното отклонение от нула е незначително и нулевата хипотеза е приета: стойностите са независими, ако r xy > r cr , тогава се приема хипотезата H1: считаните стойности са зависими.

Алгоритъмът за изчисляване на коефициента на параметрична корелация по метода на линейната Пирсънова корелация:

N N

1. Определете сумите от сериите x и y (∑x i и ∑y i ).

i = 1 i = 1

2. Изчислете аритметичните средства от сериите x и y (`x и`y).

3. Изчислете разликата (dx) на всеки индикатор от серия x и средноаритметичната стойност на тази серия (dx = x i –`x), както и разликата (dy) на всеки индикатор от серия y и средната аритметична стойност на x (dy = y i -` y) ,

4. Квадратни dx и dy (dx² и dy²).

5. Индикаторите dx и dy се умножават помежду си.

6. Изчислете коефициента на линейна корелация (rxy):

rxy = + N ∑ (dh * dy) i = 1
NN ∑ dx² * ∑ dy² i = 1 i = 1

7. Да се ​​оцени представителността (представителността) на коефициента на корелация според таблицата на критичните стойности (таблица 4.1).

Таблица 4.1 Критичните стойности на коефициента на корелация (r xy )

n '= n - 2 Нива на значимост n '= n - 2 Нива на значимост
0.05 0.01 0.05 0.01
0.75 0.87 0.37 0.47
0.71 0.83 0.36 0.46
0.67 0.80 0.36 0.46
0.63 0.77 0.35 0.45
0.60 0.74 0.33 0.42
0.58 0.71 0.30 0.39
0.55 0.68 0.29 0.37
0.53 0.66 0.27 0.35
0.51 0.64 0.25 0.33
0.50 0.62 0.23 0.30
0.48 0.61 0.22 0.28
0.47 0.59 0.21 0.27
0.46 0.58 0.20 0.25
0.44 0.56 0.17 0.23
0.43 0.55 0.16 0.21
0.42 0.54 0.14 0.18
0.41 0.53 0.11 0.15
0.40 0.52 0.10 0.13
0.40 0.51 0.09 0.12
0.39 0.50 0.07 0.10
0.38 0.49 0.06 0.09
0.37 0.48 0.06 0.09

8. За да се оцени стегнатостта на корелацията в таблица 4.2.

Таблица 4.2 Степента на плътност на коефициента на корелация

Степен на общуване Коефициент стойност
Малък (слаб) 0,01 - 0,30
Средно (умерено) 0,31 - 0,70
Голям (силен) 0,71 - 1,00

Забележка: Може да се говори за наличието на тясна корелация при r xy от поне 0.7.

Непараметричният коефициент на съответствие на Spearman се използва за оценка на връзката между количествените атрибути, които не се подчиняват на закона за нормално разпределение на честотата или качествени (порядъчни) характеристики. В последния случай стойността на атрибута не може да бъде измерена, но различни стойности могат да се сравняват помежду си и да се подреждат във възходящ или низходящ ред по качество.

Например 1-ви клас, 2-ри клас и др., 1-во място, 2-ро място, 3-то място и т.н., т.е. всеки следващ обект е по-нисък по качество спрямо предишния. Серийният номер на всеки обект се нарича ранг , подреждането на обектите е класиране .

За изучаване на качествени показатели се излагат непараметрични хипотези, които се тестват с помощта на подходящи критерии, опериращи с рангове, които не използват никакви данни от закона за разпространение. Ако приложите критерия за ранг към количествените характеристики, той ще бъде по-малко ефективен от съответния параметричен критерий, тъй като извадка, състояща се от количествени стойности, е по- информативна в сравнение с порядъчните стойности. Когато работите с количествени атрибути, критериите за класиране по-рядко от параметричните отхвърлят нулевата хипотеза. И ако нулевата хипотеза бъде отхвърлена от критерия за ранг, тогава параметричните критерии няма да доведат до различен резултат.

Алгоритъм за изчисляване на непараметричен коефициент на ранг корелация според метода на Spearman:

1. Определете ранговете (x и y).

2. Изчислете разликата на ранговете (d).

3. Изчислете квадрата на ранга (d²).

4. За да се изчисли коефициентът на ранг корелация:

N

r xy = 1 - 6 * ∑ d² / n (n² - 1),

i = 1

където n е броят на двойките от корелираните серии;

6 е постоянен коефициент.

5. Да се ​​установи представителността на коефициента съгласно таблица 4.3.

Ако r xy <r cr на дадено ниво на значимост, тогава приемете нулевата хипотеза, че поредицата от знаци не са свързани помежду си. Ако r xy > r cr на дадено ниво на значимост, приемете алтернативната хипотеза за наличието на корелация между разглежданите характеристики.

Таблица 4.3 Критичните стойности на ранга на коефициента на корелация (r cr )

п Нива на значимост п Нива на значимост
0.05 0.01 0.05 0.01
1.00 0.42 0.53
0.89 1.00 0.41 0.52
0.78 0.94 0.40 0.51
0.72 0.88 0.39 0.50
0.68 0.83 0.38 0.49
0.64 0.79 0.38 0.48
0.61 0.76 0.37 0.48
0.58 0.73 0.36 0.47
0.56 0.70 0.36 0.46
0.54 0.68 0.36 0.45
0.52 0.66 0.34 0.45
0.50 0.64 0.34 0.44
0.48 0.62 0.33 0.43
0.47 0.60 0.33 0.43
0.46 0.58 0.33 0.42
0.45 0.57 0.32 0.41
0.44 0.56 0.31 0.41
0.43 0.54 0.31 0.40

3. Концепцията за регресионен анализ. Обхват. Изчисляване на коефициента на регресия, регресионни скали, сигма регресия. Видове причинно-следствени връзки и техните характеристики

Регресията е функция, която позволява да се определят средните стойности на друг атрибут чрез стойността на един корелационен (свързан) знак. С помощта на регресия може да се установи как едно количество се променя количествено, когато се променя друго количество. За да се определи размерът на тази промяна, се използва регресионен коефициент .

Коефициентът на регресия R x / y е абсолютната стойност, с която атрибутът се променя средно, когато друг атрибут се промени с един.

Формулата за изчисляване на коефициента на регресия:

R x / y = r xy σ y ,
σ x

където R x / y е коефициентът на регресия,

r xy е коефициентът на корелация,

σ x и σ y са стандартните отклонения за ред x и ред y.

Използвайки коефициента на регресия без специални измервания, можете да определите стойността на един от признаците (например телесно тегло), знаейки стойността на другия (растеж).

За тези цели се използва уравнението на линейна регресия . Помислете за външния му вид, когато определяте зависимостта на телесното тегло на човека от ръста му:

y = M y + R x / y (x - M x ),

където y е желаната стойност на телесното тегло,

x е известният темп на растеж,

R x / y - коефициент на регресия при определяне на зависимостта на телесното тегло на човек от ръста му,

M y - средната стойност на телесното тегло, характерна за дадена възраст,

M x - средната стойност на растежа, характерна за дадена възраст.

В практиката за изучаване на физическото развитие на деца и юноши има метод за оценка на физическото развитие по регресионни скали .

Индивидуалните стойности на отделните знаци са много разнообразни: за хора с еднакъв ръст, телесната маса и параметрите на обиколката на гърдите могат да се колебаят в най-широкия диапазон. Мярка за разнообразието на индивидуалните размери на характеристиката се характеризира с регресионна сигма (σ Rx / y ) , която се изчислява по формулата:

σ Rx / y = σ y 1- r xy 2

където σ y е стандартното отклонение на измерената характеристика (например телесно тегло),

r xy е коефициентът на корелация.

Методът на регресионен анализ е широко използван в научната дейност и практическата медицина.

Алгоритъмът за изчисляване на коефициента на регресия:

NN

1. Определете сумите от сериите x и y (∑x i и ∑y i ).

i = 1 i = 1

2. Изчислете аритметичните средства от сериите x и y (`x и` y).

3. Изчислете разликата (dx) на всеки индикатор от серия x и средноаритметичната стойност на тази серия (dx = x i –`x), както и разликата (dy) на всеки индикатор от серия y и средноаритметичната стойност на „y (dy = y i - y).

4. Квадратни dx и dy (dx² и dy²).

5. Индикаторите dx и dy се умножават помежду си.

6. Изчислете коефициентите на регресия (Rxy и Ryx):

Rxy = N ∑ (dhdy) i = 1 ; Ryx = N ∑ (dhdy) i = 1
N ∑ dy² i = 1 N ∑ dx² i = 1

7. Оценка на представителността чрез изчисляване на грешката в извадката

(µR xy и µR yx ).

µ Rxy = ± ; µ Ryx = ±

Степента на представителност се определя от критерия Т

с n ′ = n - 2 и ниво на значимост 0,05.

txy = гху ; tyx = Ryx
µ Rxy µ Ryx

Съществува определена връзка между коефициентите на корелация и регресия , което позволява да се изчисли единият от другия . Тя може да бъде изразена чрез формулата:

rxy = + √ Rxy Ryx





; Дата на добавяне: 2015-04-20 ; ; Преглеждания: 445 ; Публикуваните материали нарушават ли авторските права? | Защита на личните данни


Не намерихте това, което търсите? Използвайте търсенето:

Най-добри поговорки: Като двойка, един учител каза, когато лекцията приключи - това беше краят на двойката: „Тук нещо мирише на края“. 8830 - | 8358 - или прочетете всичко ...

Прочетете също:

border=0
2019 @ ailback.ru

Генериране на страница за: 0,01 сек.