Сетевая экономика и проектирование информационных систем

 

Система классификации и кодирования информации

Слово кодирование происходит от латинского «codex» (свод законов).

Система кодирования – совокупность знаков и правил их использования для представления информации.

Кодирование предназначено для перехода от обозначений объектов на естественном языке к обозначениям на формализованном языке, удобном для машинной обработки.

Рассмотрим кодирование реквизитов-признаков. Задача состоит в том, чтобы закодировать элементы производственного процесса: предметы и результаты труда, средства труда и сам труд.

Основное требование, которое предъявляется к кодовому обозначению – это однозначное соответствие между кодом и объектом кодирования. Кроме того, кодовое обозначение может нести некоторую информацию об объекте, которую нужно использовать в алгоритмах машинной обработки. Подобные коды называются семантическими.

Системы кодирования могут носить локальный характер, то есть они могут быть приняты только на данном предприятии. Если система предназначается для всей страны, или, может быть, для всего мира, то она называется глобальной.

Попытки создать глобальные коды приводят к удлиннению разрядности кодов в то время, как обмен информацией между предприятиями и странами возникает нечасто. Лучше пользоваться локальной системой, которая при необходимости легко может быть преобразована в глобальную.

Существуют следующие системы кодирования:

Порядковая. Объекты кодируются числами натурального ряда. Используется для кодирования небольших и устойчивых номенклатур объектов. Например, код семейного положения: единица означает холост, двойка – женат, тройка – разведен, четверка – вдовец.

Серийная. Она является развитием предыдущей системы и предусматривает выделение серии номеров для кодирования каждого класса объектов. Перед присвоением номеров, объекты подлежат укрупненной классификации. Например, сотрудники, работающие на предприятии постоянно, имеют первую серию табельных номеров, работающие по совместительству – вторую, а временно работающие – третью.

Повторений. По этой системе код представляет собой повторение какого-либо количественного признака объекта. Например, год 2005 может быть закодирован как 05.

Классификационная. Система основана на классификации объектов кодирования и записи в разрядах кодового обозначения значений признаков классификации. Различают две системы классификации объектов кодирования:

  • последовательную (иерархическую),
  • параллельную (фасетную).

В последовательной классификации различают классы, подклассы, группы, подгруппы, виды, подвиды и т.д. Схема последовательной классификации представлена на рис. 2.4.

Рис. 2.4 Схема последовательной классификации

α - признак классификации, в примере имеющий два значения: α1 и α2.

При последовательной классификации количество объектов в классификационных группировках постепенно уменьшается на нижних уровнях.

Схема параллельной классификации представлена на рис. 2.5. При параллельной классификации каждый новый признак классификации обращается ко всему исходному множеству объектов. Следовательно, объектам должны быть присущи все признаки классификации, что не требовалось при последовательной классификации.

В одну и ту же классификационную группировку даже нижнего уровня обычно попадает не один, а несколько объектов. Поэтому значений признаков классификации самих по себе недостаточно для придания однозначного соответствия между кодом и объектом. По этой причине прибегают к смешанным системам, в которых старшие разряды – значения признаков классификации, а младшие – это порядковая система кодирования для придания однозначного соответствия. Старшие разряды делают код семантическим.

 

Рис. 2.5. Схема параллельной классификации.

Рассмотрим примеры смешанных систем кодирования:

Пример 1. Система кодирования готовой продукции по ОКП. Перед присвоением кода используется общесистемный классификатор промышленной и сельскохозяйственной продукции (ОКП). По этой системе можно закодировать всю готовую продукцию страны.

Пример 2. Система кодирования деталей и сборочных единиц по ЕСКД. Кодирование в этом примере соответствует единой системе конструкторской документации (ЕСКД):

Здесь приняты обозначения: X - цифра; A - буква.

Перечислим требования к системе кодирования:

  • Однозначное соответствие между кодом и объектом.
  • Семантичность, необходимая для алгоритмов машинной обработки.
  • Постоянная длина кода для всех обозначений (равномерность), поскольку поля в памяти имеют постоянную длину для реквизитов данного наименования.
  • Наличие резерва в разрядности кода для кодирования новых объектов.
  • Возможность стыковки локальной и глобальной систем кодирования, позволяющая осуществить переход от одной системы к другой.
  • Возможность легкого запоминания кодов человеком-оператором.
  • Возможность обнаружения и исправления ошибок.

После установления множества объектов, подлежащих кодированию, и выбора системы кодирования наступает этап собственно кодирования, т.е. присвоения объектам кодовых обозначений. Итоги этой работы представляются в кодификаторах (классификаторах).

С целью глобализации и стандартизации систем классификации и кодирования информации создана единая система классификации и кодирования (ЕСКК), структура которой представлена на рис. 2.6.

Рис. 2.6. Единая система классификации и кодирования

Как видно из рис. 2.12, система состоит из трех комплексов, центральный из которых содержит общесистемные (федеральные) классификаторы, в том числе: объектов административно-территориального деления, предприятий и организаций, природных и трудовых ресурсов, управленческой документации, единиц измерения, технико-экономических показателей, ОКП и т.д.