Авиационно инженерство Административно право Административно право Беларус Алгебра Архитектура Безопасност на живота Въведение в професията „психолог” Въведение в икономиката на културата Висша математика Геология Геоморфология Хидрология и хидрометрия Хидросистеми и хидравлични машини Културология Медицина Психология икономика дескриптивна геометрия Основи на икономически т Oria професионална безопасност Пожарна тактика процеси и структури на мисълта, Професионална психология Психология Психология на управлението на съвременната фундаментални и приложни изследвания в апаратура социалната психология социални и философски проблеми Социология Статистика теоретичните основи на компютъра автоматично управление теория на вероятностите транспорт Закон Turoperator Наказателно право Наказателно-процесуалния управление модерна производствена Физика Физични феномени Философски хладилни инсталации и екология Икономика История на икономиката Основи на икономиката Икономика на предприятията Икономическа история Икономическа теория Икономически анализ Развитие на икономиката на ЕС Спешни ситуации ВКонтакте Однокласници Моят свят Facebook LiveJournal Instagram
border=0

Класификация на данните. Проблеми с представянето на данни

След обсъждане на характеристиките на кодирането и предаването на информация, изглежда естествено да се разглеждат въпроси, свързани с съхранението на информация. Преди това определението за формална информация беше дадено като резултат от поредица от двоични избори (вж. Т.2.2.). На практика обаче (и на ниво домакинство) информацията се разбира като информация за нещо. Тези дефиниции не си противоречат, ако не следим семантичната страна на информацията и се опитваме да оценим тяхната значимост (значимост), т.е. запази формалността на подхода.

Заедно с термина „информация” , терминът „данни” често се използва за описание на информационните процеси . Определяме го по следния начин:

Данните са информация, характеризираща система, явление, процес или обект, представена в специфична форма и предназначена за по-нататъшна употреба.

Следните коментари следва да бъдат направени в това определение, като се обяснява връзката между понятията информация и данни:

· Данните са специфична форма на представяне на съдържанието на информацията (например информацията за резултатите от мониторинга на температурата на околната среда може да бъде представена под формата на цифров масив (таблица), но е възможно както под формата на графика, така и под формата на текстово описание с помощта на определен език);

· За разлика от ненасочената (нецелена, разпръсната) информация, която съществува в природата, независимо от нас и нашите нужди за нея, данните се наричат ​​само такава информация, която е важна за потребителя и следователно осигурява използването й за решаване на всякакви проблеми; с други думи, практическото състояние и важността на данните са по-високи от тези на естествената информация.

Разбира се, при решаването на практически задачи с помощта на технически средства, формата за представяне на информацията е винаги специфична и някой се интересува от информация, затова използването на термина “данни” е напълно оправдано.

Понятието "данни" е много широко. Тя обхваща както определена стойност, например годината на раждане на лицето или името му, така и показанията на датчик или информация за производството на дадена компания. На ниво домакинство данните се идентифицират с информация и следователно не се разглеждат никакви информационни масиви. Например, текст на литературно произведение или учебник, картина на художник, филм не се считат за данни, но данните са данните, съдържащи се в тях. В компютърните системи няма такова разграничение и всяка информация, представена във форма, приемлива за компютър - текстове, снимки, музика и др. - се счита за данни. В компютърните науки данните включват също програмни текстове, съхранявани на външни носители или заредени за изпълнение в компютърната памет. Това разширено тълкуване на термина данни ще бъде посочено по-долу.

На данните се приписват няколко класификационни знака. Най-важният от тях е типът данни. Типът данни определя:

· Набор от валидни стойности;

· Правилата за тяхното обработване (преобразуване);

· Редът за тяхното поставяне в RAM и OVC по време на съхранение;

· Редът за достъп до тях (т.е., движение и преместване, ако е необходимо, от мястото на съхранение).

Валиден набор от типове данни и техните характеристики се определят от софтуерната система или програмния език, в който е написана системата. Същевременно възможностите на езиците в разнообразието от допустими типове данни, както и изграждането на нови типове, се различават доста силно. Ясно е, че колкото по-обширна и гъвкава е въвеждането на данни в софтуерна система или език, толкова повече възможности са предоставени на потребителя при решаване на проблема с оптималното представяне, съхранение и прилагане на данни. Въвеждането на данни също влияе на компактността на самата изпълнима програма. Например, в езика BASIC няма тип „запис”; В резултат на това, за да създадете и използвате база данни, ще трябва да организирате паралелна обработка на няколко масива.

Следващият знак е разделяне на данните на елементарни (единични, прости) и структурирани (сложни).

Атомните данни включват символи, числа (цели и реални) и логически данни. Обща и задължителна характеристика на отделните данни е, че всяка от тях има една стойност и собствено име. Стойността е съдържанието на онези клетки от паметта, където се намира това. Името (наричан още идентификатор) е обозначението, дадено в текста на програмата. Правилата за конструиране на идентификатори на елементарни данни се определят от езика за програмиране на писмената програма.

Елементарните данни са „градивни елементи“ чрез комбиниране на сложните данни, които се изграждат . Има много възможности за комбиниране - това води до появата на много видове структури от данни.

Информационен масив, който комбинира данни и отношения (отношения) между тях, се нарича структурирани данни.

Списъкът от обединени единични данни, техните характеристики, както и характеристиките на връзките между тях формират структурата на данните.

Примери за структурирани данни са страница от дневника на класа с имената на учениците, дати на класове и марки, телефонен указател, организационна структура на институцията и др.

Списъкът с приемливи структури от данни, както вече беше споменато, се определя от езика за програмиране или от приложната програма. Той може да бъде фиксиран (не разширяем), както в езика BASIC или приложните програми без вградени възможности за програмиране. В разработените езици за програмиране (PASCAL, C и др.) И редица приложни системи, заедно със запазените типове структури от данни, създаването на нови типове е позволено, а елементите на структурата могат да бъдат сложни данни, например масив от записи.

Сложните данни, като елементарните, имат стойности и идентификатори. Стойностите се поставят в RAM клетки според определени схеми (виж стр. 6.3.3.). Правилата за конструиране на идентификатори са установени от програмен език или софтуерна система. Изключение правят правилата за генериране на имена на файлове - те се задават от операционната система и трябва да бъдат последвани от всички програми и езици, които се изпълняват на нея. Например в MS-DOS като имена на файлове могат да се използват комбинации от латински букви, цифри и някои специални символи с обща дължина не повече от 8 знака; в Windows 95 (98), която има 32-битова файлова система, имена до 255 знака са разрешени без ограничения за използвания набор от символи.

Когато е възможно, промените в стойностите на данните (прости и структурирани) в хода на общата обработка се подразделят на променливи и константи (константи). От името е очевидно, че променливите могат да променят стойността си по време на изпълнението на програмата, но константи не го правят. На ниво операционна система няма разлика между променливи и постоянни стойности, поради което те имат един и същ ред на разполагане в RAM и достъп до тях. Разделянето може да се извърши в програмен език и съответно в приложна програма, създадена с него; Подобно разделение служи като допълнителна мярка за синтактичния контрол на коректността на програмата.

В зависимост от етапа на обработване на данните, те се разделят на начални (входни), междинни и изходни. Изходните данни са необходими за изпълнението на програмата и са влезли в нея преди или по време на работа. Изходните данни могат да бъдат предварително записани на някой носител и въведени от него, получени чрез комуникационни линии от някои сензори или от други компютри, въведени от потребителя на програмата чрез входни устройства. Междинните данни се генерират по време на изпълнението на програмата и по-често потребителят не е на разположение; те не се показват на изходните устройства, но съществуват в RAM или в OVC. Идентификаторите на междинни данни се определят от разработчика на програмата или самата програма се определя в съответствие с правилата, определени в него. Изходните данни са резултат от програмата - заради тях и обработката на входа. Отпечатъци, предназначени за лице, се представят във формата, която се изисква от него (текстове, рисунки, звуци); когато изходните данни се съхраняват на носител или се предават по мрежи, бинарният компютърен формат на тяхното представяне се запазва. По този начин работата на програмата може да се разглежда като действия за конвертиране на входните данни за извеждане чрез необходимото междинно звено. От гледна точка на самата програма, всички тези типове са еднакви, т.е. се обработват само според техния вид, а не по предназначение или етап.

Представянето на данни при тяхното съхранение и обработка изисква решаване на три основни задачи:

· Определяне на начините за представяне на елементарни (прости) данни;

· Определяне на начините за комбиниране на данни в структури;

· Установяване на начини за поставяне на информация на материална среда.

Има три нива на представяне на данните - концептуални, логически и физически. На концептуално ниво се дефинира общата структура на информационния масив - тя се нарича модел на данните. Известни са и се използват няколко модела данни: йерархична, мрежова, релационна, обектно-ориентирана. В съответствие с избрания модел на данни се изгражда информационна система, в която ще се съхраняват данните, както и програмите, водещи до тяхната обработка (манипулиране на данни). Логическото ниво определя начините за представяне на елементарни данни, техния списък, когато са комбинирани в структура, както и естеството на връзките между тях в рамките на избрания модел на данни. Физическият слой определя форматите за поставяне на създадената логическа структура на данни на външни носители (магнитни или оптични дискове, хартия, в компютърна памет). Представянето на данни е важен фактор за осигуряване на компактен (т.е. икономичен от гледна точка на консумацията на медията) метод за записване на информация по време на съхранение и бърз достъп до необходимите данни при използването му. След това ще бъдат разгледани решения на изброените задачи в компютърните системи.





Вижте също:

Понятието за ефективност на системата от номера

Пример 4.2

Моделите се проверяват и не се проверяват

Пример 7.2

Пример 7.7

Връщане към съдържанието: Теоретични основи на компютърните науки

2019 @ ailback.ru