КАТЕГОРИЯ:


Астрономия- (809) Биология- (7483) Биотехнологии- (1457) Военное дело- (14632) Высокие технологии- (1363) География- (913) Геология- (1438) Государство- (451) Демография- (1065) Дом- (47672) Журналистика и СМИ- (912) Изобретательство- (14524) Иностранные языки- (4268) Информатика- (17799) Искусство- (1338) История- (13644) Компьютеры- (11121) Косметика- (55) Кулинария- (373) Культура- (8427) Лингвистика- (374) Литература- (1642) Маркетинг- (23702) Математика- (16968) Машиностроение- (1700) Медицина- (12668) Менеджмент- (24684) Механика- (15423) Науковедение- (506) Образование- (11852) Охрана труда- (3308) Педагогика- (5571) Полиграфия- (1312) Политика- (7869) Право- (5454) Приборостроение- (1369) Программирование- (2801) Производство- (97182) Промышленность- (8706) Психология- (18388) Религия- (3217) Связь- (10668) Сельское хозяйство- (299) Социология- (6455) Спорт- (42831) Строительство- (4793) Торговля- (5050) Транспорт- (2929) Туризм- (1568) Физика- (3942) Философия- (17015) Финансы- (26596) Химия- (22929) Экология- (12095) Экономика- (9961) Электроника- (8441) Электротехника- (4623) Энергетика- (12629) Юриспруденция- (1492) Ядерная техника- (1748) Arhitektura- (3434) Astronomiya- (809) Biologiya- (7483) Biotehnologii- (1457) Военни бизнесмен (14632) Висока technologies- (1363) Geografiya- (913) Geologiya- (1438) на държавата (451) Demografiya- ( 1065) Къща- (47672) журналистика и смирен (912) Izobretatelstvo- (14524) външен >(4268) Informatika- (17799) Iskusstvo- (1338) историята е (13644) Компютри- (11,121) Kosmetika- (55) Kulinariya- (373) културата е (8427) Lingvistika- (374) Literatura- (1642) маркетинг-(23702) математиците на (16968) Механична инженерно (1700) медицина-(12668) Management- (24684) Mehanika- (15423) Naukovedenie- (506) образователна (11852) truda- сигурност (3308) Pedagogika- (5571) Poligrafiya- (1312) Politika- (7869) Лево- (5454) Priborostroenie- (1369) Programmirovanie- (2801) производствено (97 182 ) индустрия- (8706) Psihologiya- (18388) Religiya- (3217) Svyaz (10668) Agriculture- (299) Sotsiologiya- (6455) на (42831) спортист строително (4793) Torgovlya- (5050) транспорт ( 2929) Turizm- (1568) физик (3942) Filosofiya- (17015) Finansy- (26596) химия (22929) Ekologiya- (12095) Ekonomika- (9961) Electronics- (8441) Elektrotehnika- (4623) Мощност инженерно ( 12629) Yurisprudentsiya- (1492) ядрена technics- (1748)

Статистически графики




Статистически таблици

Статистическа маса е форма на рационално, визуално представяне на данните и резултатите от статистическите изследвания на явления и процеси. Таблиците ни позволяват да се разгледа статистиката или резултатите заедно, адекватно и точно, покриваща сложната природа на явленията.

Статистическа маса се състои от името на таблицата, при условие, предикат, и стойностите на статистически показатели (например, числени данни).

От името на таблицата [1] узнае за:

а), която определя обхвата на въпроси и илюстрира таблицата;

б) Какви са географските граници на набор от обекти, представени от масата;

в) какви са периодите или моменти във времето съответства на масата;

г) Какви са мерните единици (ако те са едни и същи за всички клетки на таблицата). Ако блоковете не са идентични, а след това не забравяйте да посочите в горния или страничен хедъра, в който единици са статистиката (тонове, единици и др рубли.).

Предметът на масата - списък с имена на единици в популацията, т.е. обект на изследване. The предиката на масата - това е името на статистическите параметри, описващи предмета. Предметът обикновено е оставена като струни на имена, глагол - на върха на имената на графиката.

В основата на статистически таблици е неговото оформление - на колоната (колони) и редове с техните заглавия, имена. За завършване на масата трябва да се направят конкретни данни пресечната точка на всеки ред и колона.

Чрез строителството, предмет на масата може да бъде проста, група, Раман.

Обикновено така наречената статистическа таблица, в една тема, която не разполага с групи. Простите таблици са perechnevye (обект - в списъка на единици, които съставляват предмета на изследване) (. Даден списък на зони, страни, региони, и т.н.), териториални, Поредица (в обект дадена дата или час периоди).

Имената на редовете (предмет) Заглавия граф (предикат)
Списък на съставните единици

Фигура 3.1. Разпределение на статистически таблици.

Група, наречена на масата, при пациент, който е изучавал предмет е разделен на групи въз основа на който и да е на земята.

Matching маса нарича такъв, когато се дава в предмет групиране на няколко основания, взети в комбинация.

Таблиците се различават в развитието на предиката: прости и сложни. Обикновено развитието на предиката включва успоредно подреждане на фигури и сложно развитие - комбинирано.



Например, при проектирането на прост първото предикатно може да се дава на колоните, които съдържат данни за населението със съответното ниво на образование (основно, средно, и т.н.). При проектиране на комплекс предикат след графиките на населението с определена степен на образование са показани в отделни колони с данни, съответстващи на броя на мъжете и жените.

Тя е разработила редица изисквания за съставяне и регистрационни таблици.

Таблица 1. желателно да даде броя на номериране. Това улеснява използването на масата дава възможност да се ориентират по-добре, показва метод за изчисляване на данните в колоните. Първата колона, съдържаща предмет са означени с главни букви; колони, съдържащи предиката, номерирани с арабски цифри. Заглавията и предмет линии на графиката на предиката трябва да се формулират кратко, точно и ясно. Всички думи в заглавието на темата и масата на предикатното са написани изцяло от шанс. Headers графика трябва да бъдат формулирани така, че да има ясно значение на тази стойност и реда за неговото изчисляване.

2. цитиран в темата и първоначални признаци трябва да се постави в логически ред, като се вземе предвид необходимостта да ги разгледа заедно. Обичайната принципа на настаняване - от частно към общо, т.е. Първите покажи гледна точка, но в края обобщим (ако е необходимо). Когато не всички условия са дадени, но само най-важните от тях, се прилага обратния принцип - първо покаже общите резултати и след това се разграничат най-важната част ( "Total", "Total", "включително", "От тях").

3. Таблица, доколкото е възможно, следва да бъде кратка, но може да бъде придружен от бележки, които посочват източниците на данни, по-подробно разкрива съдържанието на показатели са и други обяснения, както и резерва (ако таблицата съдържа информация, получена от изчисление).

4. Когато предоставят маси обикновено се използват символи:

тире "-", когато явлението отсъства;

× - ако явлението не е смислено съдържание;

точки "...", когато няма информация за размера си (или е "няма информация" влизане).

5. Ако информацията е на разположение, но по-малко от най-високата цифровата стойност в таблицата на точност, е представена от фракция (0.0). Заоблените номера, дадени в таблицата със същата степен на точност (до 0.1, и 0.01, и т.н.). растеж от лихви, в много случаи, е препоръчително (от 300% или повече), за да замени връзката в пъти. Например, за да напишете "1000%" и "10,0 пъти".

Графиката в статистиката наречените конвенционални снимка числени стойности и техните взаимоотношения в различни геометрични форми - точки, линии, равнинни фигури и т.н. Символи дават видимост на изходните данни, помагайки да се въведат законите, които често са трудно да се види в сложните статистически таблици и големи числени масиви. Статистика История предоставя много примери за използване на графични изображения, за да се визуализира на явленията. Към днешна дата, основни графични съчетания, изпълнявани в електронна таблица системи (MS тип Excel), както и статистически анализ на данни в компютъра (STATISTICA, SPSS, STATGRAPH, SAS, и така нататък). Това е всичко, графична илюстрация е показано по-долу са получени.

Разнообразието на статистически графики, дължащи се на различни цели, методи на строителство, дисплеят на дълбочина от явления и процеси. Поради това е важно не само да се знае вида на графиките, но също така притежава техниката на тяхното изграждане. Всяка схема се състои от графично изображение и спомагателни членове.

Графично изображение - набор от точки, линии и форми, чрез които изобразява статистика. Поддържащите елементи на графиката са както следва:

1) Полеви графика - пространство, в което са настанени на графични изображения. Областта се характеризира с формат си, т.е. размер и пропорции;

2) пространствена ориентация, определяне на местоположението на графичните изображения. Пространствена ориентация набор системни мрежи и контурни линии, които разделят на графиката на парчета. статистически диаграми, използвани като правоъгълна и полярна координатна система;

3) ако е необходимо, за да съответства на графично представяне на обекта и реалните му размери са амбициозни цели. Обширна насоки, дадени от люспите на система мащаб или мащаби марки. Massive мащаб съобщава за всяка координатна ос на графиката. Деления се използват основно за статистическа карта;

4) обяснение на график, състояща се от обект обяснение, графика (нейното име) и семантичното значение на всеки знак, използван в графиката. Името на програмата трябва да бъде кратко и точно да разкрие съдържанието му. Обяснителните текстове могат да бъдат разположени в рамките на графично изображение или в непосредствена близост до него (тагове), както и наложени извън него (ключа).

Статистически графики могат да бъдат класифицирани като дестинация (съдържание), методът на строителство, както и естеството на символа.

За да бъде идентифициран сравнение цел в космически схеми, графики различни относителни величини (структурата, динамиката и т.н.), графики вариация серия, поставяне на графика на територията, свързани помежду си графична производителност. Има различни комбинации, като например показване на промяната на времето или изменението на свързаните с тях показатели.

Съгласно метода на конструиране могат да бъдат идентифицирани графични изображения:

диаграма е графично представяне на статистически данни ясно показва връзката между сравняваните стойности;

картограми представляващи контурни карти, които се излюпили по някакъв начин показва относителната интензивност на явлението в процес на проучване в рамките на един-единствен елемент на териториално деление. Разнообразие от картограма е kartodiagramma когато сравнителна диаграма се характеризира с интензитета на фигурата (образа на гори, обработваема земя, дрехи и т.н.) и неговия размер.

В момента, за повечето графики, използвани за показване диаграми. Тя може да бъде диаграма точка, линия, равнина и обем. Видовете планарна графика са подутини, квадратна, кръгла, пай, временни, къдрава диаграми.

Фигура 3.2. Производството на електроенергия в отделните страни
през 1996 г. (млрд кВтч). Бар-графика.

A бар диаграма се използва за сравняване на подобни показатели, които характеризират различни предмети или области. Стойности в сравнение с параметри изобразени като правоъгълници с една и съща ширина и са разположени на обща хоризонтална базовата линия. Ако базовата линия е вертикална, а след това се говори за преминаване на лента или лента диаграма. височина (или дължина) на всяка колона от определен мащаб съответства на фигурата изобразява. Баровете могат да бъдат разположени или в тясно сътрудничество на еднакво разстояние. Band схема е особено полезно, ако отделните сравнения на обектите се характеризира с обратен знак на показателите (например процент на растеж). Един пример на диаграма е показана на Фигура 3.2, графиката лента - под 3.3.

Фигура 3.3. Производството на електроенергия в отделните страни
през 1996 г. (млрд. кВтч). Strip диаграма.

Понякога обекти се характеризират с рязко в сравнение стойности варират значително показатели. В тези случаи се използват специални видове равнинни графики: квадратна или кръгла. Тяхното строителство се основава на факта, че стойностите на изобразените фигури трябва да бъдат пропорционални на областите на квадратите или кръговете и квадратни корени на стойностите, които се сравняват пропорционална на линейните размери на тези цифри. Например, преброяването на населението на 09 октомври, 2002 г., Броят на постоянно население на Руската федерация в размер на 145 182 000 Pers..; градове на Москва, Санкт Петербург, Новосибирск, съответно, 10375800. души., 4,669,400. души. и 1,425,600. души. За да представи тази информация с помощта на бар диаграма е практически невъзможно, тъй като височината на колоната (Руската федерация) ще има 14 пъти височината на другия, в сравнение с Москва, 31 пъти в сравнение с Санкт Петербург и 102 пъти, в сравнение с Новосибирск. Връзка корен квадратен от населението (.. милиона души) са съответно 12,049: 3218: 2161: 1194. Като се има предвид броя на хората на единица Новосибирск, получаваме отношения страна на площада - 10.1: 2.5: 1.8: 1. Площади с приблизително съотношение на екрана са показани на фигура 3.4.

Фигура 3.4. Постоянното население на Руската федерация и на най-големите градове на 9.10.2002 г

За да се покаже структурата на явлението в процес на проучване се използва кръгови диаграми, в които основната геометричен параметър е ъгълът между радиусите на секторите, сумата от всички ъгли (360 °), което се равнява на 100%. Друга форма на картографиране на структурата или състава на явлението е лентово подразделят ленти.

Изразителността на кръгови диаграми се осигурява чрез разделяне на населението в малък брой части - не повече от 10 кръгова диаграма изглежда доста убедително, но със значителни разлики в сравнение структури. Друга форма на структурни статистически диаграми са лентово специфични тегла (Фигура 3.6).

Например, в анализ показва, че населението в региона на следните класове според размера на разполагаемия доход. Под формата на диаграми резултатите са показани на Фигури 3.5-3.6.

Видове добиви от населението Дял на населението,%
1. Ниски доходи 38.0
2. Долна-среден доход 31.5
3. Средното ниво на доходите 20.3
4. по-висок среден доход 6.2
5. Високо ниво на доходите 4.0

Фигура 3.5. Кръгова диаграма. Структурата на населението на региона от ниво на разполагаем доход.

Фигура 3.6. население Strip структура модели на региона от ниво на разполагаем доход (%)

За изображения на процеси, протичащи във времето, се прилага динамично (временно) диаграма. Признаци на такива символи на класациите са точките и ги свързват в серия линия (обикновено прав), сгъване в счупените криви, дава представа за промяната във времето на това явление в процес на проучване. В х-оста е време оста на равномерно поставени знаци, и оста у - оста на стойностите, които отнема изследван показател с течение на времето. Конфигурацията на всеки по една динамична крива графика отразява показателите за смяната на времето: неговия растеж или спад (Фигура 3.7).

Фигура 3.7. Валутна (обмен) курс на рублата през 1998-1999.

За разпределението на серията на изображението (серия на вариация) се прилагат криви, построени в правоъгълна координатна система. Няколко разпределение показва повторение на дадена характеристика стойност от звената на населението. Толкова близо е, например, разпределението на населението на региона в групи (видове), в зависимост от нивото на разполагаемия доход.

популации ниво на доходите (търкайте. на месец) Население%
1. До 750 28.6
2. 750 - 1350 32.5
3. 1350 - 1950 15.4
4. 1950 - 2700 13.3
5. 2700 - 3750 5.4
6. 3750 - 4650 2.3
7. 4650 - 6000 2.5
общо

Interval разпределение номер да се показва или в бар форма графика или под формата на натрупват. Dots и линии хистограма изразяват броя на дяловете на населението, се дължи на една-единствена стойност атрибут в съответния интервал. Така, функцията хистограма характеризира гъстотата на разпределение и е графично аналог на кривата на разпределение на плътността на вероятността теория. В нашия пример, за изграждане на хистограма предварително определяне на стойности на плътност в интервала [2].

Хистограма характеризиращ се с това цялата си площ е равен на общия брой на единици в популацията (в този случай 100%). Това общо се състои от области на правоъгълници, построени на съответните интервали. Площта на всеки правоъгълник е равна на произведението на основата (интервал ширина) до (стойност плътност в интервала) височина. На равни интервали плътност на разпределение е пряко пропорционална на относителната честота или честоти, които обикновено се използват за конструиране и правоъгълници. На различни интервали, само хистограмата се основава на ценностите на плътност.

Друг начин графично представяне на разпределението на серията на интервал е натрупват. кумулативната крива (с натрупване) е представена от сумата на честотите натрупани в началото и в края на всеки интервал. Примери на хистограма и натрупват е показано на Фигури 3.8 и 3.9.

групи ниво на доходите (търкайте. на месец) Население% Interval атрибут променя, THS. Rub. процент плътност (процент от населението от 1000. трия. доход) Кумулативният (с натрупване) броят на стойностите на населението,%
1. До 750 28.6 0750 38.133 28.6
2. 750 - 1350 32.5 0600 54.167 61.1
3. 1350 - 1950 15.4 0600 25.667 76.5
4. 1950 - 2700 13.3 0750 17.733 89.8
5. 2700 - 3750 5.4 1050 5.143 95.2
6. 3750 - 4650 2.3 0.900 2555 97.5
7. 4650 - 6000 2.5 1350 1852
общо - - -

Фигура 3.8. разпределение Хистограма на населението на региона
нивото на разполагаемия доход

Координатите на точки на кумулативна крива е показано по вертикалната ос Y броя на населението (в този случай - на дела от населението), за които максималната стойност на знака не надвишава посочено по оста X. Така, кумулативната крива е аналог на кривата на разпределение функция на теорията на вероятностите. Графиката показва, че през първото тримесечие на населението (25%) на нивото на доходите не е повече от 0,70 хил. Разтрийте. (Точната стойност на първата четвърт - .. 692.6 рубли / човек), половината от населението (50%) ниво на доход не надвишава 1,1 хиляди рубли .. (Медиана или втората четвъртина е равна на 1109.7 рубли.) За 75% от равнището на доходите на населението е не по-висока от 1900 търкайте. / Човек. (Точната стойност на така наречената трета четвъртина, равна на 1863.5 рубли.).

Когато дискретен вариант характеристика графика е подредена поредица от разпространение на депото. Депото може да бъде построена, например, за разпределението на работниците на предприятието въз основа на заустване, разпределение къща с апартаменти на броя на живеещите в тях, семействата на разпределения на броя на децата и т.н. Polygon разпределение е затворен полигона (чрез дал своята база - X ос), на абсцисната на върховете са ценности различна характеристика и ординатата - съответната честота. Натрупват за дискретен брой подобно изобразяван интервал ред. Понякога натрупаната характеристика честота се появява под формата на ogives. Ogives графика, в които нивата на ордината игрални се показват по абсцисата и кумулативна честота (или относителната честота).

Фигура 3.9. Разпределение на населението от равнището на разполагаемия доход в региона (натрупват).

От многото парцелите, които имат специфични функции, помисли за концентрацията на графики и начини за графично представяне не е основна групирани данни.

концентрация диаграма позволява да се визуализира на характера на поставянето на индикатора за сила на звука тест за някои понятия от същите групи индикатори (видовете) единици от населението. (Например, разпределението на общата парична доходите на населението на региона чрез типичната - по отношение на рентабилността - групи от населението). Графики от този вид са ясно процесите на концентрация и дават възможност за сравнение дълбочината на тези процеси за различни показатели за обема и статистически агрегати. Например, вие може да се сравни степента на концентрация на доходите на населението в различните региони.

За да се построи графиката на концентрация (крива на Лоренц) по хоризонталната ос представлява кумулативната част от общия брой на единици в популацията (например, натрупания дял на населението), а вертикалната ос - натрупания дял от обема на изучаваната показател (общата сума на пари от населението). По-нататъшното концентрацията на действителната линия (Lorenz крива), въз основа на посочените координати, се отклонява от диагонала на правоъгълника - равномерното разпределение линия, - по-висока е степента на концентрация на явлението на изследване.

Отношението на площта на графиката, ограничена от линия на равномерно разпределение и кривата на Лоренц за района на известен като фактор на концентрацията, известен като коефициентът на Джини половината правоъгълник:

Тук, стр I, стр аз + 1 - сума в размер на натрупания брой на тежести в съзвездието за аз и (I + 1) групи, съответно;

Q I, Q I + 1 - сума на специфичните тегла натрупани въз основа на обема на I, (I + 1) групи, съответно.

При изчисляването на коефициента на концентрация (Коефициент на Джини) стойностите на специфичните тегла се използват под формата на относителните стойности на конвенционален (не на сто). Пример на крива концентрация доход е показан на фигура 3.10. График е изграден върху следните данни.

Групи от населението (и) Кумулативният (с натрупване) процентът на населението и) Кумулативният (с натрупване) процентът на доходите и)
0003 0.00016
0.286 0,10309
0.611 0,33467
0.765 0,50934
0898 0,72214
0.952 0,84031
0.975 0.9074
1.00 1.00

Както се вижда от графиката, разпределението на общата парична сума на приходите отклонява от еднакъв. По-специално, 50% от населението е не повече от една четвърт (24,1%) от общия размер на приходите в брой за определен период от време. Нивото на концентрация на доходите, определена от коефициента на Джини, е равно на 0,362.

Интерес представляват специални начини за графично показване на суровите данни в т.нар изследователския анализ. За визуалните характеристики на набор от наблюдения, използвани цифри проучването (тип графика «Box и Whiskers» - «кутия с мустаци") и симетрията на графики ( «Стволовите и Leaf»). За да се построи преглед фигурата ( «Box и Whiskers») набор от наблюдения на базата на предварително подредени във възходящ ред, и след това се разделя на 4 равни числа части. Освен това последователно определена характеристична величина, която разделя първата част от второ (първата четвъртина), втората част на третия (втората четвърт), третият от четвърта или трета четвърт. Максималната стойност на знака заедно е четвъртата четвърт. Сегментите на графика линия показват мястото на минималните характерните стойности и четирите четвъртини. Линиите на първата и третата четвърт определят позицията на "кутията". Вътре в тази "кутия", тъй като той подписа 50% от случаите със средна стойности черта. Минималната и максималната стойности са свързани ( «Whiskers» - мустаци) със стените на "кутия". В рамките на "кутията" е ред на втората четвърт (средната черта, медиана) [3]. В резултат на изготвянето ярко описва структурата на населението и симетрията на първоначалните данни в средната [4]. Пример график "Box и Мустаците" е показан на фигура 3.11. Ясно показва на определени нива асиметрия квартилни спрямо медианата.

Съвременните системи за статистически данни за компютъра ви позволяват да се представят в графична форма многоизмерен наблюдение. Един общ начин за представяне на многомерни наблюдения са графики като "звезди" ( "звезди") и "лъчи" ( "Слънчеви лъчи"). Всеки обект е показан като отделна фигура, чиито размери позволяват да я сравни с други по същия оригинален населението. На графиката "звезди" от центъра на всеки от многомерен обект чрез равен ъгъл идват ос, съответстващи на отделните герои. На осите са отбелязани признаци на нивата на тези маркери са свързани с линии. Тъй като знаците са различни единици и величина на числен израз на осите маркиране се извършва в относителна форма. Максималната стойност съответства на характеристика 1.

Графики "Рейс" се основава на стандартизирана статистически данни, признаци на нивата, показани в броя на стандартното отклонение. Тук, в средата на всеки лъч съответства на средната стойност на атрибута.

На графиката "звезди" на осите, надвишаващи характерната стойност в съответния обект, обикновено не се показват (на фигура 3.11, за яснота, оста е напълно запазен). На класациите, "оси лъчите са показани в пълен размер, дължината на всяка ос (" Рей ") обикновено е в границите от -3 до +3 стандартно отклонение.

Фигура 3.10. крива концентрация на доходите на населението в региона.

Фигура 3.11. Панорамна снимка ( «Box и Whiskers») ниво на рентабилност от 53 предприятия
(Вграден в системата STATISTICA).

Един пример за графично представяне на многомерни наблюдения за 4 обекти е показан на фигура 3.12 (x1 - на нивото на продукцията; x2 - индекс на разходите; x3 - рентабилност; x4 - сложността на продукта; х5 - делът на работниците в числеността на персонала).


Фигура 3.12. Характеристики на компании, включени в класациите "звезди".

За да се анализира матрица връзка се използва т.нар графики, връзката в които всяка двойка корелационни характеристики показва поле. Всички полета корелационни са обединени в един единствен диаграма матрица. На мястото на точките на съответствието на полето и регресия във всяка клетка на диаграмата на матрица сключва за посоката и нечетлив статистическа връзка, съответстваща признаци двойката. Пример за такава диаграма е показана на фигура 3.13.

Фигура 3.13. Корелация критерии: възвръщаемост на активите, броя на служителите, стойност на дълготрайните активи
(Фигура получен в STATISTICA система)

Контролен лист

1. Определяне на обобщенията и обединението.

2. Видове статистическата групировка

3. Методологически проблеми на статистическата групировка

4. Понятието многомерни и комбинираните групи

5. Концепцията и елементи на статистически таблици

6. Концепцията и основни статистически графики