КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Методы классификации и кодирования ТЭСИИерархический метод классификации ГОСТ 6.011-87 дал следующее определение понятию «классификация». Классификация – это разделение множества объектов на подмножества по их сходству или различию в соответствии с принятыми методами. При использовании иерархического метода происходит последовательное разделение множества объектов на подчиненные классификационные группировки. Получаемая на основе этого метода классификационная схема имеет иерархическую структуру. В ней первоначальная информация классифицируемых объектов детализируется на каждой ступени классификации. Классификаторы, построенные на основе иерархического метода классификации, имеют неограниченную емкость, которая зависит от глубины классификации (число ступеней деления) и основания кода (число знаков в алфавите кода). Выбор необходимой глубины классификации и соответственно структуры кода зависит от характера объектов классификации и характера задач, для решения которых и предназначен данный классификатор. Серьезным недостатком иерархического метода является жесткость классификационной схемы. Она обусловлена заранее установленным выбором признаков классификации и их использованием по ступеням классификации. Это ведет к тому, что при изменении состава объектов классификации, их характеристик или решаемых с помощью классификатора задач, требуется коренная перестройка всей классификационной схемы. При разработке классификаторов следует учитывать, что иерархический метод предпочтителен для объектов с относительно стабильными соподчиненными признаками и для решения стабильного комплекса задач. К классификаторам, построенным на основе иерархического метода, предъявляются определенные требования, соблюдение которых повышает качество классификатора и удобство его использования. Первым таким требованием является непересекаемость классификационных группировок, расположенных на первой ступени классификации. Это означает, что классификационные группировки, расположенные на первом уровне классификации, не должны включать аналогичных понятий. 2-е общее правило: на каждой ступени классификации для разделения вышестоящей группировки должны использовать только один признак. 3-е правило: логичность и последовательность деления группировок на нижестоящие ступени и полнота этого деления. В соответствии с этим на верхних ступенях классификации должны использоваться признаки, к которым в дальнейшем будет обращаться наибольшее число запросов. Полнота деления означает, что сумма подмножеств всегда должна давать делимое множество объектов и не должна оставаться какая-то часть объектов, не вошедших в состав классификационных группировок. Таким образом, достоинства иерархического метода обеспечили ему широкое использование в различных классификационных схемах.
Порядковый и серийно-порядковый методы кодирования Кодирование представляет собой процесс перевода информации из одной системы знаков в другую, т.е. перевод записи на естественном языке в запись с помощь. Кодов Порядковый метод кодирования – это такой метод, при котором кодами служат числа натурального ряда. В этом случае каждый из объектов классификационного множества кодируется с помощью текущего номера. Данный метод кодирования обеспечивает довольно большую долговечность классификатора при незначительной избыточности кода. Таким образом, этот метод обладает наибольшей простотой, использует наиболее короткие коды и лучше обеспечивает однозначность определения каждого объекта классификации. Кроме того, он обеспечивает наиболее простое присвоение кодов новым объектам, появляющимся в процессе ведения классификатора (каждому новому объекту присваивается следующий по порядку номер). Недостатки: 1.отсутствие в коде какой-либо конкретной информации о свойствах объекта; 2.сложность машинной обработки информации при получении итогов по группе объектов классификации с одинаковыми признаками; 3.не обеспечивает возможности размещения вновь появившихся объектов классификации в необходимом месте классификатора, т.к. резервные коды располагаются в конце ряда. Т.е. метод не часто применяется отдельно при создании классификатора ТЭСИ. Чаще всего применяется в сочетании с другими методами кодирования. (Пример – классификатор валют). Серийно-порядковый метод кодирования(например, ОКПДТР, классификатор специальностей по образованию) - это метод, при котором кодами служат числа натурального ряда с закреплением отдельных серий этих чисел за объектами классификации с одинаковыми признаками. В каждой серии кроме кодов имеющихся объектов классификации, как и при порядковом методе кодирования, предусматривается определенное количество кодов для резерва. Резерв кодов располагается в середине или в конце серии, и это является большим преимуществом данного метода по сравнению с порядковым методом кодирования. Этот метод целесообразно применять для объектов, имеющих два соподчиненных признака. Метод обладает всеми преимуществами и недостатками порядкового метода кодирования. Несмотря на наличие в кодах построенных по этому методу кодирования определенных элементов классификации, они чаще всего используются для идентификации объектов в сочетании с классификационными методами кодирования.
Фасетный метод классификации В современных классификаторах ТЭСИ широко используется и второй метод классификации – фасетный. Под ним понимается параллельное разделение множества объектов на независимые классификационные группировки. Т.е. заранее жесткой классификационной схемы не создается. Разрабатывается лишь система таблиц по признакам объектов классификации, называемых фасетами. При необходимости создания классификационной группировки для решения конкретной задачи осуществляется выборка необходимых признаков из фасета и их объединение в определенной последовательности. Такой принцип построения классификационных группировок делает классификатор очень гибким, хорошо приспособленным для использования в условиях большой динамичности характера решаемых задач. При изменении характера задач или характеристик объектов разрабатываются новые фасеты или дополнительными новыми признаками (значениями признаков) уп. существующие без коренной перестройки структуры всего классификатора. При разработке классификатора на основе фасетного метода также должны соблюдаться определенные правила, несоблюдение которых затрудняет использование классификатора. В соответствии с этим правилом состав признаков одного фасета не должен повторяться в других фасетах этого же классификатора. Второе правило: включение в состав классификатора только таких фасетов и признаков на них, которые необходимы для решения конкретной задачи.
Последовательный метод кодирования Сложные классификационные методы кодированияпредполагают предварительное разделение множества объектов на классификационные группировки в соответствии с выбранными признаками классификации. Классификационные методы бывают двух видов – последовательный и параллельный. Последовательный метод кодирования – метод, при котором код классификационной группировки или объекта классификации образуется с использованием кодов последовательно расположенных соподчиненных группировок, полученных при иерархическом методе классификации. В этом случае код нижестоящей группировки образуется путем добавления соответствующего количества разрядов коду вышестоящей группировки. Этот метод используется при иерархическом методе классификации. Достоинства: - логичность построения кода; - большая емкость; - возможность получения итогов по высшим разрядам кода. Недостатки: - обладает всеми недостатками, присущими иерархическому методу классификации; - ограниченные возможности идентификации объектов; - использование этого метода связано с определенными трудностями: в результате зависимости значений последующих разрядов кодов от предыдущих применять этот код по частям нельзя, группировать объекты по различным сочетания имеющихся признаков также сложно и практически невозможно вносить новые признаки и производить изменения в коде без коренной перестрой классификатора. Применять последовательный метод кодирования целесообразно в тех случаях, когда набор признаков классификации и их последовательность стабильна в течение длительного времени. Относится к классификационным метод код-я, как и последовательный. Параллельный метод кодирования – это метод, при котором код классификационной группировки или объекта классификации образуется с использование кодов независимых группировок, полученных при фасетном методе классификации. При этом методе кодирование признаки объекта кодируются независимо друг от друга. Для этого метода возможны два варианта записи кодов объектов: 1. каждый фасет или признак внутри фасета имеют свои коды, которые включаются в состав кода объекта. Такой способ записи удобно применять тогда, когда объекты характеризуются неодинаковым набором признаков и различным их числом. При формировании кода какого-либо объекта берутся только необходимые признаки. 2. для определенных групп объектов выделяется фиксированный набор признаков и устанавливается стабильный порядок их следования, т.е. устанавливается фасетная формула. В этом случае не надо каждый раз указывать значения какого признака приведено в определенных разряда кода объекта. Достоинства: - гибкость структуры кода, обусловленная блочностью его построения. Этот метод позволяет использовать при решении конкретных технико-экономических и социальных задач коды только тех признаков объектов, которые необходимы, что дает возможность работать в каждом отдельном случае с кодами небольшой длины. При этом методе кодирования можно осуществлять группировку объектов по любому сочетанию признаков; - хорошо приспособлен для машинной обработки информации. По конкретной кодовой комбинации легко указать набором каких характеристик описывается рассматриваемый объект. При этом из небольшого числа признаков можно образовать большое число кодовых комбинаций. Набор признаков при необходимости может легко пополняться присоединением кода нового признака. Это свойство особенно важно при решении технико-экономических задач, состав которых меняется со временем. Этот метод целесообразно использовать для кодирования однородных объектов, т.к. в противном случае реальной становится лишь незначительная часть сочетаний признаков, и емкость классификатора будет использоваться неполностью. И это является недостатком данного метода кодирования. Классификационные методы кодирования характеризуются тем, что даже при глубокой классификации объектов код несет информацию по классификационной группировке, но не всегда идентифицирует конкретный объект, а в отличие от них регистрационные методы, хорошо выполняя функцию идентификации объектов, не несут информацию об их свойствах. Поэтому и идентификационные, и классификационные методы чаще всего применяются в классификаторах в сочетании друг с другом.
|