КАТЕГОРИИ:


Астрономия- (809) Биология- (7483) Биотехнологии- (1457) Военное дело- (14632) Высокие технологии- (1363) География- (913) Геология- (1438) Государство- (451) Демография- (1065) Дом- (47672) Журналистика и СМИ- (912) Изобретательство- (14524) Иностранные языки- (4268) Информатика- (17799) Искусство- (1338) История- (13644) Компьютеры- (11121) Косметика- (55) Кулинария- (373) Культура- (8427) Лингвистика- (374) Литература- (1642) Маркетинг- (23702) Математика- (16968) Машиностроение- (1700) Медицина- (12668) Менеджмент- (24684) Механика- (15423) Науковедение- (506) Образование- (11852) Охрана труда- (3308) Педагогика- (5571) П Архитектура- (3434) Астрономия- (809) Биология- (7483) Биотехнологии- (1457) Война- (14632) Високи технологии- (1363) География- (913) Геология- (1438) 1065) House- (47672) Журналистика и масови медии- (912) Изобретения- (14524) Чужди езици- (4268) Компютри- (17799) Изкуство- (1338) История- (13644) Компютри- (11121 ) Художествена литература (373) Култура- (8427) Лингвистика- (374 ) Медицина- (12668 ) Naukovedenie- (506) Образование- (11852) Защита на труда- ( 3308) Педагогика- (5571) P Политика- (7869) Право- (5454) Приборостроение- (1369) Программирование- (2801) Производство- (97182) Промышленность- (8706) Психология- (18388) Религия- (3217) Связь- (10668) Сельское хозяйство- (299) Социология- (6455) Спорт- (42831) Строительство- (4793) Торговля- (5050) Транспорт- (2929) Туризм- (1568) Физика- (3942) Философия- (17015) Финансы- (26596) Химия- (22929) Экология- (12095) Экономика- (9961) Электроника- (8441) Электротехника- (4623) Энергетика- (12629) Юриспруденция- (1492) Ядерная техника- (1748) Олимпиада- (1312) Политика- (7869) Право- (5454) Инструменти- ( 1369) Програмиране- (2801) Производство- (97182) Промишленост- (8706) Психология- (18388) Земеделие- (299) Социология- (6455) Спорт- (42831) Строителство- (4793) Търговия- (5050) Транспорт- (2929) Туризъм- (1568) Физика- (3942) ) Химия- (22929 ) Екология- (12095) Икономика- (9961) Електроника- (8441) Електротехника- (4623) Енергетика- (12629 )

Решението. Нулевата хипотеза на VUT е, че разликата между емпиричното разпределение на чертата и равномерното разпределение е статистически незначителна.




Нулевата хипотеза на НО е, че разликата в емпиричното разпределение на чертата от еднаквото разпределение е статистически незначителна. Ако това предположение е вярно, тогава всички 36 субекта със същата вероятност може да избере някой от четирите отговора. Така че теоретичната честота е ,

Таблица 4.3

честоти Характеристични стойности
Много важно важно незначителен Не е важно в общия

Изчислете емпиричната стойност на критерия съгласно формулата (4.1):

Намерете критичната стойност chi-square в таблицата за ниво на значимост и брой на степените на свобода , Така че , т.е. 2,22 <7,815, наблюдаваните стойности са в съответствие с нулевата хипотеза и не дават основание да се отхвърлят. Така че, при грешка от 5%, може да се твърди, че в общото население стойностите на атрибута са разпределени равномерно.

Задача 2. Използвайки теста на Pearson's chi-square, тествайте хипотезата за нормалното разпределение на характерните стойности, групирани на интервали от една и съща дължина.

Таблица 4.4

интервали 5-9 10-14 15-19 20-24 25-29 30-34
честоти

решение

Стъпка 1. Изберете ниво на значимост , хипотези:

: Емпиричното разпределение на характера съответства на нормалното право.

: Емпиричното разпределение на характеристиката е статистически значително различно от нормалното разпределение.

Стъпка 2. Изчислете числените характеристики на пробата - средната стойност на пробата и стандартно квадратично отклонение , За да направите това, във всеки интервал изберете средата на интервала като "представител": , , , , , ,

;

; след това ,

Стъпка 3. Изчислете вероятностите на стойностите на знака, попадащи на частични интервали. това, което трябва да изчислите теоретичните честоти ,

;

;

;

;

;

;

;

,

Стъпка 4. Попълнете изчислителната таблица и намерете емпиричната стойност на критерия "chi-square", използвайки формулата (4.1).

Таблица 4.5

интервали Емпирични честоти вероятност Теоретични честоти = Условията
0.0166 0.64 0.64
0.0416 1.66 3.29
0.1130 4.52 0.05
0.1990 7.96 0.00
0.2179 8.72 0.59
0.1447 5.79 0.84
0.0598 2.39 1.08
0.0287 1.15 1.15
сума - -

В долния десен ъгъл на таблицата е желаната емпирична стойност. ,

Стъпка 5. Намерете критичната стойност за ниво на значимост и брой на степените на свобода (очакваното нормално разпределение е параметър), като се използва таблица 9 (виж Приложения).



Стъпка 6. Изтеглете изводите . Така че , след това на нивото на значимост Няма причина да се отрече съответствието между емпиричното и нормалното разпределение на чертата (хипотезата се приема ). Несъответствията между емпиричното разпределение на чертата и нормалните разпределения не са статистически значими.

Забележка. Възможно е да се изчислят теоретичните честоти, като се използва формулата

, (4.9)

където ( - средни интервали). В задача 2: , , , , като се използва таблицата с стойностите на функциите ,


Лекция 10. Сравнение на емпиричното разпределение на чертата.

съдържание

1. Сравнение на две емпирични черти

2. Сравнение на повече от две емпирични разпределения на дадена черта

1. Сравнение на две емпирични черти

На различни етапи от психологическото изследване е необходимо да се формулират и експериментират някои от твърденията (хипотезите), от които зависи валидността и ефективността на прилаганите методи за анализ. Например, ако има няколко групи изходни данни, възниква въпросът: можем ли да приемем, че пробите са взети от една обща популация, дали са хомогенни.

Пробите се наричат хомогенни, ако се извличат от една и съща популация и следователно имат едни и същи закони за разпространение.

Задачата за сравняване на разпределението на една характеристика в две или повече проби (задачата за определяне на хомогенността на пробите ) възниква, например, при сравняване на резултатите от наблюденията в експерименталната и контролната група.

Задачата за тестване на хомогенността на пробите е еквивалентна на задачата за тестване на хипотезата, че няма разлика между две или повече емпирични разпределения. За да се установи хомогенността на пробите, можете да използвате критерия за еднородност. който е приложим, когато (дори по-добре, ако е изпълнено условието ) и данните са представени в групирана форма.

Нека има две проби по обеми. и , Елементите на всяка проба са независими, непрекъснати и групирани равни интервали. Необходимо е да се определи дали пробите принадлежат към една и съща популация.

Изследвана хипотеза : Образците принадлежат към една и съща обща популация, т.е. имат едни и същи, но неизвестни функции за разпространение.

Алтернативна хипотеза : Образците принадлежат към различни популации и имат различни закони за разпространение.

За да изчислите се използват различни модификации на изчислителната формула (4.1), което позволява да се опрости процеса на изчисляване. По-долу в задачите са дадени различни формули за изчисляване на емпиричната стойност в зависимост от броя на сравняваните проби и начина на представяне на първоначалните данни .

След попълване на изчислителната таблица на критерия "чи-квадрат" е необходимо да се определи броят на степените на свобода където - броя интервали (алтернативи, отговори на темите и т.н.), - броя на сравняваните разпределения и намиране на критичната стойност (вж. таблица 9 от приложението). ако , несъответствията между разпределенията не са статистически значими (на ниво от хипотеза се приема ). ако тогава разликите между разпределенията са статистически значими.

Започваме проучването на сравнението на две емпирични разпределения ( ) от обикновения случай, когато знакът се измерва в дихотомна скала ( ). Първоначалните данни за две емпирични разпределения за сравнение помежду си могат да бъдат представени по различни начини. Най-лесният начин е "таблицата с четири полета". Имайте предвид, че в този случай формулата за изчисляване могат да бъдат различни.

Задача 1 . След дипломирането си от две институции с икономически профил, в специалността от първия институт работят 90 души, а от 80-те (и двете групи млади специалисти са 100).

Има ли съществени различия в успеха на наемането на завършилите университет?

решение

Помислете за хипотеза за липсата на значителни разлики в успеха на наемането на завършилите. Степента на значимост се приема, че е 0,05.

Първият метод на изчисление - използвайки формулата

, (4.10)

Да представим първоначалните данни под формата на таблица с четири полета.

Таблица 4.6 - Действителни честоти на характеристиката

Характеристични стойности (алтернативи) Първият университет Втори университет в общия
Намерих работа А = 90 Най- = 80 А + В = 170
Не е заето C = 10 D = 20 C + D = 30
само А + С = 100 B + D = 100 А + В + С + D = 200

В таблицата с очакваните теоретични честоти на характеристиката (таблица 4.7) се изчисляват теоретичните стойности на честотите, които са равни на съотношението на продуктите от сумите в редове и колони спрямо общия резултат.

Таблица 4.7 - Очаквани теоретични честоти на характеристиката

Характеристични стойности Очаквани честоти на характерните стойности в общия
Първият университет Втори университет
Намерих работа = = = =
Не е заето = = = =
Общо (проверка)

Теоретична честота - показва броя на завършилите първите университети, които би трябвало да бъдат наети, и - - които не би трябвало да бъдат наети и т.н.

Таблица 4.8 - Таблица за изчисление за изчисление

Характеристични стойности (алтернативи) Емпирична честота Очаквана теоретична честота
Намерих работа Университет 1 90-85 = 5 0.29
ХЕИ 2 80-85 = -5 0.29
Не е заето Университет 1 10-15 = -5 1.67
ХЕИ 2 20-15 = 5 1.67
само в общия

,

Изчислете броя на степените на свобода според формулата където - броя на алтернативите - броя на сравнените проби. Според таблицата на критичните стойности "chi-square" намираме ,

Район на района

незначителността на различията

различията в разпределението

Фигура 4.2

стойност се появиха в "зоната на значимост на различията", което означава, че с надеждност от 0,95 може да се говори за наличието на значителни разлики в емпиричното разпределение на знака "успех на заетостта на завършилите висше образование". Наблюдаваните разлики между заетостта на завършилите висше образование не са случайни, а университетите могат да се считат за значително различни в успеха на наемането на завършилите висше образование.

Обмислете втория метод за изчисляване на емпиричната стойност на критерия за случай на дихотомна характеристика ( ) за две проби ( ) - според формулата

, (4.10)

където - или общия брой на участниците в двете проби.

Задача 2. Различават ли се разпределението на мъжки и женски имена в бележника на психолога X и психолога Y?

психолог Броят на имената в тетрадките на психолозите
Мъжки имена Женски имена
Психологът Х
Психологът W

решение

Изследваният атрибут "имена в бележници на психолози" се измерва в дихотомен мащаб, което означава , Две преносими компютри се изследват - това означава, че броят на сравняваните проби е равен на , Проверете хипотезата че няма разлика между двете емпирични разпределения, т.е. пробите са хомогенни.

Базовите данни са представени под формата на таблица с четири полета. Заменете изходните данни , , , , във формулата (4.10) получаваме:

,

Броят на степените на свобода е , нивото на значимост ще избере , Според таблицата на критичните стойности "chi-square" намираме ,

стойност следователно, при ниво на значимост от 0,05, няма причина да се отхвърли хипотезата, че няма статистически значима разлика между двете емпирични разпределения. Това означава, че пробите са хомогенни.

Сега ще решим проблема, в който се сравняват две проби ( ), имащи повече от две възможни стойности на функцията ( ). Предполагаме, че всяка проба е групирана равни интервали.

Таблица 4.10 - Разпределение на характерните стойности в две проби

интервали ... Размер на извадката
Характерна честота Първа извадка ...
Втората извадка ...

Преброяване на емпиричната стойност на критерия за такъв случай се извършва съгласно формулата

, (4.11)

където и - брой посещения в - първия интервал на групиране на първия и втория образец по обем и ; - броя интервали за групиране.

Еквивалентно на (4.11), формулата е:

, (4.12)

Забележете, че за проби със същия размер формулата (4.12) има формата

, (4.13)

Критична стойност е на масата. Колкото по-малка е изчислената стойност , се формират по-благоприятните условия за приемане на хипотезата за хомогенността на двете проби. при хипотеза приет, в противен случай - отхвърлен.

Задача 3 . На два факултета на същия университет се установи успехът на знанията на учениците от висшата математика. За тази цел студентите бяха избрани на случаен принцип и в двата факултета и компютърните тестове бяха проведени с тях. Знанията бяха оценени по скала от 100 точки. Резултатите от теста са показани в таблицата.

Проверете предположението, че няма значителна разлика в нивото на математическото познание на учениците от различните факултети.

Таблица 4.11

факултети Брой на учениците, които са спечелили точки и оценките си суми
По-малко от 55 точки "2" От 56 до 70 точки "3" От 71 до 85 точки "4" От 86 до 100 точки "5"
Химически (50 студенти) = 3 = 20 = 18 = 9
Механика (50 студенти) = 8 = 19 = 10 = 3
суми

решение

Анализът на данните в таблицата показва, че отдела по химия е около три пъти по-малко от студентите, получили "2", и три пъти повече от броя на студентите, получили "5". Но заключението, че учениците от химическия факултет показват по принцип по-добри резултати от механичните студенти, може да се направи само след обработка на статистически данни.

Представяме таблица за изчисление на критерия "чи-квадрат" за сравняване на двете емпирични разпределения с помощта на формула (4.12).

Таблица 4.12

Интервалите за групиране на маркерите Емпирични честоти Условията
За отдела по химия За механичния факултет
По-малко от 55 точки = 3 = 8 = 871.1
От 56 до 70 точки = 20 = 19 = 250
От 71 до 85 точки = 18 = 10 = 537.8
От 86 до 100 точки = 9 = 3 = 490
сума = 50 = 40

Заменете тези задачи във формулата (4.12), получаваме:

Емпирично значение по-малко от критичната стойност , т.е. получените разлики са в областта на незначителността. С други думи, нулевата хипотеза трябва да бъде приета. "За сходството", че нивото на математическото познание на учениците от два факултета не е статистически значимо помежду им.

По-горе, във визуалния анализ на експерименталните данни беше предложено студентите от химическия факултет да показват по-добри резултати от механичните. Но тестът "Чи-квадрат" показа, че не е така.


2. Сравнение на повече от две емпирични разпределения на дадена черта

Помислете за проблем, при който има три проби с четири стойности на характеристиката във всяка . За да изчислим емпиричната стойност на критерия, използваме формулата (4.10) ,

Задача 4. За да се изучи отношението на студентите към нова форма на провеждане на класове по математика, бяха интервюирани 120 студенти втора година от три отдела по хуманитарни науки, икономика и химия.

Има ли разлики в мненията на респондентите?

Таблица 4.13 - съотношението на учениците към класовете по математика

Алтернативи (избор на отговори) факултети само
хуманитарен икономически химически
Много положително А 5 Б 8 На 18
положително G 7 D 10 Е 15
С съмнение W 11 Н 6 И 6
отрицателно К 15 L 10 М 9
само

решение

Нека разгледаме основната хипотеза за отсъствието в общото население на значителни различия в мненията на студенти от три факултета. Алтернативна хипотеза е, че има значителна статистическа връзка между факултета, в който студентът изучава, и начина, по който той оценява новите форми на провеждане на класове по математика. Степента на значимост се приема, че е 0,05.

Да се ​​намери очакваната теоретична честота на стойностите на еднакво разпределен знак на стойността за всяка клетка на таблицата умножаваме съответните честоти, представени в последната колона и последния ред, и разделяме на общия брой респонденти (120). Например, очакваната честота за клетка (А) е ; за клетка (D) - и така нататък

За да изчислите Попълнете таблицата, в която алтернативата за всички факултети включва алтернативата "Много положителна" в таблицата.

Таблица 4.14 - Очаквани теоретични честоти на характеристиката

Алтернативи (избор на отговори) факултети само
хуманитарен икономически химически
Много положително = = =
положително = = =
С съмнение = W =
отрицателно = = =
само

Сега ще попълним изчислителната таблица, за да изчислим емпиричната стойност на теста chi-square.

Таблица 4.15 - Схема на изчисление

алтернативи Емпирични честоти Теоретични честоти
Много положително А 9.8 -4,8 2351
B 8.8 -0,8 0.073
Най- 12.4 5.6 2529
положително D 10.1 -3,1 0.951
D 9.1 0.9 0.089
E 12.8 2.2 0.378
С съмнение F 7.3 3.7 1875
W 6.5 -0,5 0038
и 9.2 -3,2 1113
отрицателно K 10.8 4.2 1633
L 9.6 0.4 0017
М 13.6 -4,6 1556
само

Намерете броя на степените на свобода: , където k е броят на алтернативите, c е броят на сравнените проби.

Според таблицата на критичните стойности на разпределението на "чи-квадрата" намираме ,

Изведена стойност по-голям , С доверието0.95 хипотезата се приема че съществува значителна статистическа връзка между факултета, в който студентът учи и как оценява новите форми на провеждане на класове по математика.

Лекция 11. Многофункционален критерий рибар

(ъглова трансформация на Fisher)

съдържание

1. Понятието за многофункционален критерий

2. Описание на критерия - ъглова трансформация на Фишър

1. Понятието за многофункционален критерий

Многофункционалните критерии позволяват решаването на три вида проблеми:

1) сравнение на нивата на изследваната черта;

2) определяне на измененията в характерните стойности;

3) сравнение на разпределението на характеристиката.

Има малко ограничения относно използването на такива критерии:

· Данните от изследването могат да се представят във всякакви мащаби;

· Пробите могат да бъдат независими или зависими;

· Граници на извадката - от 5 наблюдения и повече.

Същността на всеки от многофункционалните критерии е да се определи каква част от наблюденията (субектите) в извадката се характеризира с ефекта от интерес за изследователя .

Ефектите включват:

¨ определена стойност на качествено дефинирана характеристика (например израз "Съгласен съм", избор на конкретен отговор от предложените);

¨ определено ниво на количествено измерима черта (резултат, по-висок от постигнатия резултат, решаване на проблем по-малко от контролно време);

¨ определено съотношение на стойностите или нивата на изследваната черта (по-честият избор на алтернативи А и Б в сравнение с C и D, преобладаване на положителните промени спрямо отрицателните).

Многофункционалните критерии позволяват решаването на проблемите на сравненията (сравнения на "нива", оценка на "смени", сравнение на разпределенията) чрез намаляване на данните до скалата "има ефект - няма ефект".

2. Описание на критерия - ъглова трансформация на Фишър

Предназначени са да сравняват две проби според честотата на възникване на ефекта. критерий (Ъгловата трансформация на Фишър) оценява значението на разликите между процентите на двете проби, в които е регистриран този ефект. критерий ви позволява да определите дали една от акциите е статистически значително по-висока от другата за даден размер на извадката.

Fisher's ъглова трансформация се състои в преобразуването на процентите, изразени във фракции на единица ( ), в големината на централния ъгъл който се измерва в радиани: , Когато увеличавате разликата между ъглите и и увеличаване на броя на пробите, стойността на критерия се увеличава. Колкото по-голяма е магнитудата , толкова по-вероятно е разликите да са значителни.

хипотези:

: процентът на хората, които показват ефекта, който се изследва, не е повече в първата проба, отколкото във втората проба;

: процентът на лицата, които показват изследваното въздействие в първата проба, е по - голям от този на втората проба.

Условия за прилагане на критерия рибар

1. Измерването може да се извърши във всякакви мащаби.

2. Долната граница на размера на пробата е 2-5 (ако има две наблюдения в една проба, след това най-малко 30 наблюдения в другата). Горната граница на размера на извадката не съществува

Описание на действието

Стъпка 1. Определете ценностите на свойството, което ще бъде критерият за разделяне на субектите в тези, които " имат ефект ", и тези, които "нямат ефект".

Стъпка 2. Попълнете четирите маси.

Таблица 4.16

вземане на проби Броят на наблюденията и процента суми
Има ефект Няма ефект
Първа извадка
Втората извадка
суми

Стъпка 3. Изчислете броя на участниците във всяка "клетка" и преведете тези данни в проценти. Напишете процентите в същите "клетки" в скоби. Ако един от сравняваните проценти "с ефект" е нула, тогава е необходимо да се премести "точката на делене" в някаква посока или да се изостави критерия и използвайте критерия ,

Стъпка 4. Намерете таблицата "Стойности на ъгъла (в радиани) за различни проценти" (виж Приложения) (в радиани) за всеки от сравняваните проценти "има ефект".

Стъпка 5. Изчислете емпиричната стойност според формулата

, (4.14)

където - ъгъл, съответстващ на по-голям процент; - ъгълът, съответстващ на по-малък процент; - обемът на първата проба; - обемът на втората проба.

Стъпка 6. Намерете критичната стойност

Стъпка 7. Изградете "стойностна ос" и съответствайте на стойността. със стойност ,


Район на района

незначителна област на несигурност на значението на различията

проценти от процентите

"Ефект" в пробите на пробите "ефект"

Фигура 4.3

Стъпка 8. Ако тогава на 5% ниво на значимост няма основание за отхвърляне на хипотезата , С грешка от 5% може да се твърди, че няма значителни разлики в процентите на индивидите с "ефекта" в пробите.

ако , след това на нивото на значимост хипотеза хипотезата е отхвърлена и приета , Възможно е да се говори за значителна разлика между дела на индивидите с проявление на "ефект" в пробите.

ако след това на 5% ниво на значимост е възможно да се говори за значителна разлика в пропорциите на индивидите с "ефект" в пробите и на ниво от 1% от това е невъзможно да се каже.

Задача 5. Изследователят се интересува дали двете групи се различават по успеха на задачата, ако 15 от 25 ученици от първата група са завършили задачата и 20 от 30 ученици във втората група.

решение

"Ефектът" е значението на качествения знак "задача, решен", "успехът на задачата". Ще изработим четири етажна маса, в която ще преведем показателите за успеха на решаването на проблема в проценти: ; ,

Таблица 4.17

Задачата е разрешена Търсенето не бе решено
Група номер 1 15 60% 15 + 10 =
Група 2 20 66.7% 20 + 10 =
суми 15 + 20 = 35 10 + 10 = 20 25 + 30 = 35 + 20 = 55

Намерете стойностите и съответстващи на процента "ефект" във всяка група. за значение ; за значение (според таблицата "Стойности на ъгъла (в радиани) за различни проценти". Нека изчислим емпиричната стойност

,

Район на района

незначителност на значимост

разликите в разликите

проценти от процентите

ефектът от "задачата се решава" ефектът от "задачата се решава"

Фигура 4.4

Така че за и тогава може да се твърди, че няма основания за отхвърляне на хипотезата за незначимост на наблюдаваните разлики в пропорциите на учениците в двете групи, които са решили задачата. Следователно процентът на хората, които са изпълнили задачата в групи, не се различава съществено .

Й. В. Сидоренко отбелязва, че "човек може да симпатизира само на изследователя, който счита, че разликите в 20% и дори 10% са значителни, без да ги проверяваме по критерия ". От статистическа гледна точка, това, което изглежда съществено за изследователя, не може да бъде [8, стр.163].