КАТЕГОРИЯ:


Астрономия- (809) Биология- (7483) Биотехнологии- (1457) Военное дело- (14632) Высокие технологии- (1363) География- (913) Геология- (1438) Государство- (451) Демография- (1065) Дом- (47672) Журналистика и СМИ- (912) Изобретательство- (14524) Иностранные языки- (4268) Информатика- (17799) Искусство- (1338) История- (13644) Компьютеры- (11121) Косметика- (55) Кулинария- (373) Культура- (8427) Лингвистика- (374) Литература- (1642) Маркетинг- (23702) Математика- (16968) Машиностроение- (1700) Медицина- (12668) Менеджмент- (24684) Механика- (15423) Науковедение- (506) Образование- (11852) Охрана труда- (3308) Педагогика- (5571) Полиграфия- (1312) Политика- (7869) Право- (5454) Приборостроение- (1369) Программирование- (2801) Производство- (97182) Промышленность- (8706) Психология- (18388) Религия- (3217) Связь- (10668) Сельское хозяйство- (299) Социология- (6455) Спорт- (42831) Строительство- (4793) Торговля- (5050) Транспорт- (2929) Туризм- (1568) Физика- (3942) Философия- (17015) Финансы- (26596) Химия- (22929) Экология- (12095) Экономика- (9961) Электроника- (8441) Электротехника- (4623) Энергетика- (12629) Юриспруденция- (1492) Ядерная техника- (1748) Arhitektura- (3434) Astronomiya- (809) Biologiya- (7483) Biotehnologii- (1457) Военни бизнесмен (14632) Висока technologies- (1363) Geografiya- (913) Geologiya- (1438) на държавата (451) Demografiya- ( 1065) Къща- (47672) журналистика и смирен (912) Izobretatelstvo- (14524) външен >(4268) Informatika- (17799) Iskusstvo- (1338) историята е (13644) Компютри- (11,121) Kosmetika- (55) Kulinariya- (373) културата е (8427) Lingvistika- (374) Literatura- (1642) маркетинг-(23702) математиците на (16968) Механична инженерно (1700) медицина-(12668) Management- (24684) Mehanika- (15423) Naukovedenie- (506) образователна (11852) truda- сигурност (3308) Pedagogika- (5571) Poligrafiya- (1312) Politika- (7869) Лево- (5454) Priborostroenie- (1369) Programmirovanie- (2801) производствено (97 182 ) индустрия- (8706) Psihologiya- (18388) Religiya- (3217) Svyaz (10668) Agriculture- (299) Sotsiologiya- (6455) на (42831) спортист строително (4793) Torgovlya- (5050) транспорт ( 2929) Turizm- (1568) физик (3942) Filosofiya- (17015) Finansy- (26596) химия (22929) Ekologiya- (12095) Ekonomika- (9961) Electronics- (8441) Elektrotehnika- (4623) Мощност инженерно ( 12629) Yurisprudentsiya- (1492) ядрена technics- (1748)

система за кодиране
Faceted система за класификация и ЕВРОВОК

Системата за йерархичната класификация

Окачествяването система

Класификация и кодиране на информацията

Важна концепция при работа с информация, е класификацията на обектите. Класификация - разпределителни системи обекти (обекти, явления, процеси, концепции) в класове в зависимост специфична функция.

Един обект е всеки обект, процес, явление на материално или нематериално имущество. Системата за класификация ви позволява да групирате обекти и разграничат някои класове, които ще се характеризират с редица общи свойства. Класификация на обекти - групиране процедура в качествено ниво, насочени към избора на подобни свойства. По отношение на информацията, като информация за класификация обект избрани класове се наричат ​​обекти.

Имотите се определят от параметрите на информационните информационен обект, наречен подробности. Подробностите са представени или цифрови данни, като тегло, цена, година, или признаци, като например цвят, кола правят, фамилия.

В допълнение към определянето на общи свойства на информацията за класификация обект е необходимо за разработването на правила (алгоритми) и процедури за обработка на данни, при условие, набор от данни.

Когато всяка класификация, е желателно да отговаря на следните изисквания:

· Пълнота на зоната на покритие на обектите по преценка;

· Уникалност на детайли;

· Възможност за включване на нови съоръжения.

Във всяка страна, разработени и използвани национални, секторни, регионални класификации. Например, класифицирани: промишленост, оборудване, професия, агрегати, разходни елементи и т.н.

Qualifier - системно компилация от имена и кодове на групите за класифициране. В класирането на често използваните понятия и функция класификация функция класификация стойност, които ви позволяват да зададете приликата или разликата на обекти. Възможен подход за класифициране с обединението на тези две понятия в един, на име като знак за класификация. класификация Симптом е и синоним на база делене.

В група или подгрупа, която съчетава част от класификацията на обекти на един или повече основания, се нарича класификационни групи. В основата на класификация се нарича знак, чрез който дял се определя на подмножества на определено ниво на класификация. класификация Stage - е резултат от редовни група за разпространение на обекти на същата класификация. ниво на класификация - е набор от класификационни групи, намиращи се на едни и същи нива на класификация. Дълбочината на класификационната система - броят на нивата на класификация право в системата.Всяка класификационна система се характеризира със следните свойства:

1) гъвкавост на системата;

2) на капацитета на системата;

3) степента на система за пълнене (пълнене фактор).

гъвкавост на системата - способността да се позволи включването на нови функции, обекти без да се разрушава структурата на класификатор.

Капацитетът на системата - това е най-големият брой на класификационните групи, разрешени в тази класификационна система.

Степента на напълване на системата се определя чрез разделяне на действителния брой на групи от размера на капацитета на системата.

йерархична и многостранен система за класификация: В момента, два вида системи за класификация в момента най-често използваните.

Характерни черти на йерархична система са:

1) наличие в системата на неограничен брой класификация атрибути;

2) стриктна йерархия на характеристиките на класификация, което води дял всяка класификационна група, образувана от една база, множество класификационни групи за подчинен (роб) основа.

При изграждането на йерархична система за класификация, публикуван за първи път набор от обекти, в зависимост от класификацията на M, за които с пълен набор от функции, дефинирани класификация G и тяхното подчинение един на друг, след това ние се разделя оригиналния набор от обекти по категории, е във всяко ниво на класификация.

При използване на йерархична система за класификация се прилагат следните ограничения:

1), получена при всяко ниво на категории за класификация трябва да бъде първоначалната набор от предмети;

2) класификационни групи на всеки етап не трябва да се пресичат;

3) класификацията на всяко ниво трябва да се извършва само на една база.

Въпреки това, тази система се характеризира с твърда структура на класификацията, която не позволява да се направи най-новите функции или да промени тяхната последователност. Гъвкавостта на тази система се осигурява само чрез въвеждане на голям излишък в клоновете, което води до лошо заетост на структурата на класификатор.

Поради сравнително твърд процедурата за изграждане на структура класификация, е необходимо да се започне да се определи неговата цел, т.е. какво свойства трябва да са обединени в един клас от обекти. Тези свойства са предприети в бъдеще за класификация на знаците.

йерархична система за класификация, всеки обект на всяко ниво трябва да бъдат причислени към същия клас, който се характеризира с определена стойност на избраните класификациите. За допълнително групиране на всеки нов клас трябва да се определят неговите класификация атрибути и техните стойности.

Следователно, изборът на критерии за класификация ще зависи от семантична съдържанието на класа, която изисква групиране последващото ниво в йерархията.

Предимства на йерархична система за класификация:

· Простотата на строителство;

· Използване на независими класификации в различните клонове на йерархията.

Недостатъци на йерархична система за класификация:

· Твърда структура, която води до трудно да се правят промени, тъй като трябва да преразпределя всички класификационни групи;

· Неспособност за групови обекти, като не е предварително определена комбинация от функции.

Отбелязаните недостатъци в йерархична система, няма други системи, които принадлежат към класа на многомерни системи за класификация. Аспект - оглед на класирането на обекта, който се характеризира с един или повече признаци. Многоаспектният система - система за класификация, която използва паралелни няколко независими функции (аспекти) като основа на класификация. Има два типа на многомерни системи и фасет ЕВРОВОК.

За аспект - този аспект на класификация, което се използва за образуването на независими класификационни групи. Descriptor - ключова дума, която определя концепция, която образува описание на обекта аксесоар и дава този обект към клас, група и т.н.

Faceted система се характеризира със следните строителни характеристики:

1) има набор от секретни обекти (МО);

2) комплектът може да се разглежда в няколко аспекта, всеки от които може да се характеризира с един или повече от функциите, които аспект F R;

3) е настроен да следват определен ред на фасети аспект с помощта на формулата (с последователността на фасети, се определя от честотата на използване на тези аспекти на набор от определени задачи):

F = (F 1, F 2, ..., P R, ..., P R)

4) определя броя на подгрупи на класификационни групи, броят на които се определя от редица проблеми, когато се прилага решението си за различни страни.

Фасетиран класификационна система, за разлика от йерархична класификация позволява да изберете функции, независимо един от друг, а от семантичното съдържание на класифицирана обекта. Признаци на класификация, наречена фасети (фасетни - рамка). Всеки аспект (F и) съдържа набор от еднакви стойности на атрибута на класификация. Освен това, стойностите в аспект могат да бъдат подредени в произволен ред, въпреки че предпочитаната от тях поръчка.

Диаграма на фасетиран класификационна система под формата на таблица показва на Фиг. 4.1. Имената на колоните, съответстващи на избраните критерии за класифициране (аспекти), определен P 1, P 2, ..., F и ... F н .. Например, цвят, размер дрехи, тегло и т.н. Произвежда се номериране на редове от таблицата. Във всяка клетка на таблицата се съхраняват определена стойност аспект, например, фасет цвят, определен F 2 съдържа стойностите на червено, бяло, зелено, черно, жълто.

Фасети


F и O 2 O 3 ..F ... аз ... п .F

1
...
к

ценности фасети

Фиг. 4.1. класификационна система Faceted

Процедурата за класифициране е да се възложи на всеки обект, съответстващ стойности от фасетите. Това може да се използва, не всички аспекти за всеки обект се определя от специална група на фасети структурна формула, която отразява тяхната цел:

K S = (F 1, F 2, ... F I, ..., N F),

където O аз - аз-ти аспект; п - брой на фасети.

При изграждането на фасетиран класификационна система изисква, че стойностите, използвани в различните аспекти, не се повтарят. Faceted система може лесно да бъде модифициран чрез извършване на промени в конкретни стойности на всеки аспект.

Предимства на фасетиран системи за класификация:

1) възможността за създаване на класификация с голям капацитет, т.е. Използвайте голям брой класификация атрибути и стойности, за да се създадат групи;

2) възможност за една проста промяна на цялата система за класификация, без да променя структурата на съществуващите групи.

Недостатъкът на фасетиран класификационна система е сложността на изграждането му, тъй като е необходимо да се вземат под внимание разнообразието на класификациите.

Да организира търсене на информация за поведението на thesauruses (речници) е ефективно използвани от ЕВРОВОК (описателен) класификационна система, чийто език е близък до описание на естествен език на информационните обекти.

Особено е широко използван в системата за търсене библиотека.

Същността на класификацията на метод ЕВРОВОК е, както следва:

1) избран набор от ключови думи или фрази, които описват определена предметна област или набор от еднородни предмети. И сред ключовите думи могат да бъдат синоними;

2) избрани ключови думи и фрази са обект на нормализация, т.е. от набор от един или повече синоними от най-използваните е избран;

3) създаване на речника на описания, т.е. речник на ключови думи и фрази, избран в резултат на процедурата за стандартизиране.

комуникацията е установена между описания, които се простират на площ от извличане на информация. Връзки могат да бъдат от три вида:

1) синоним, посочва определен набор от ключови думи като синоними;

2) на родово, което отразява включването на определен клас обекти в представителен клас;

3) асоциативно свързване дескриптори, които имат общи свойства.

Синоним на връзката: студент - студент - студент. На генерични комуникации: Университет - Факултет - отдел. Сдружението: студент - изпит - професорът - аудитория.

За пълен формализация на икономическа информация, която не е достатъчно проста класификация, така че следващата процедура се извършва - кодиране.

Encoding - процесът на усвояване на символи и обекти на класификационните групи за съответната система за кодиране.

Системата за кодиране - набор от правила се отнасят за обекти и групи с използването на кодове.

Код - символ на обекти или групи под формата на знак или група от знаци в съответствие със системата.

Кодът е базиран на специално азбука (набор от символи). Броят на символите за този набор се нарича код база.

Следните видове символи: числови, буквени и смесени. Системата за кодиране се използва за промяна на името на обекта на символа (код), за да се осигури по-удобна и ефективна обработка.

Code е изградена въз основа на азбуката, състоящ се от букви, цифри и други знаци. характеризира с кода:

дължина - броя на позициите в кода;

структура - от порядъка на героите в кода, използван за обозначаване на класификацията атрибут.

Процедурата за възлагане на обект кодовото обозначение се нарича кодиране. могат да бъдат идентифицирани два комплекта от методи, използвани в системата за кодиране, която се формира от (фигура 4.2.):

1) класификационна система, която се фокусира върху предварителна класификация на обекти, кодиране или въз основа на йерархична система, или въз основа на аспект на системата;

2) регистрацията система, която не изисква предварителна класификация на обекти за кодиране.


Фиг. 4.2. система за кодиране с помощта на различни методи