КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Классификационные информационно-поисковыеЯзыки
К классификационным языкам относят: информационно-поисковый язык иерархического типа; информационно-поисковый язык фасетного типа; алфавитно-предметную классификацию. Иерархическая классификация — это перечислительная классификация (т.е. все возможные классы заранее перечислены), в которой каждый класс делится на подклассы. Термины в иерархической классификации расположены в порядке их перехода от общих понятий к частному. Классификация осуществляется в зависимости от выбранных оснований деления и порядка их следования. В иерархической классификации необходимо иметь отдельные исчерпывающие классы для всех возможных предметов, т.е. все возможные классы должны быть заранее перечислены, поэтому иерархическую классификацию и называют перечислительной. Процедура построения ИПЯ иерархического типа включает следующие этапы. 1. Анализ предметной области, определение оснований деления (признаков классификации). В качестве признаков класификации выбирают такие, по которым имеет смысл производить поиск документов в данной предметной области. 2. Установление соподчиненное™ признаков. Соподчиненность может быть естественной или установленной. 3. Формирование классов документов на основе выбранных признаков классификации. Получение иерархического дерева классов. 4. Формирование индексов каждого класса. 5. Составление классификационных таблиц и алфавитного указателя. В классификационной таблице классы упорядочены по индексу, а в алфавитном указателе - по алфавиту. Индексирование с использованием ИПЯ иерархического типа заключается в определении того, к какому классу относится описываемый объект, и в определении по классификационной таблице и алфавитному указателю индекса этого класса. Преимущество языков иерархического типа состоит в простоте индексирования и поиска. Классификация наиболее эффективна в том случае, когда классы в иерархической системе располагаются в естественном порядке и набор классов в течение времени не изменяется (т.е. предметы естественно находятся в жесткой иерархической соподчиненности). Например, классификация документов в организации, имеющей стабильную структуру. ИПЯ фасетного типа основаны на принципах многоаспектной классификации, в которой каждый конкретный класс строится при индексировании по определенным правилам из предварительно заданных категориальных классов — фасетов. В системах фасетной классификации не ставится задача перечислить все сложные классы. Такие системы предлагают составные элементы, из которых по фа-сетной формуле составляется индекс. Процедура разработки ИПЯ фасетного типа состоит из следующих этапов. 1. Анализ предметной области, для которой составляется классификация. Выделение основных признаков классификации. Эти категории называются фасетами, которые при необходимости более детальной классификации могут делиться на субфасеты и т.д. 2. Все возможные простые классы группируются по фасетам. Каждый простой класс фасета называется фокусом. 3. Обозначение соответствующими шифрами фасетов и фокусов. 4. Установление фиксированной последовательности фасетов в поисковом образе (фасетная формула). 5. Составление алфавитного указателя фасет и фокусов. Преимущество ИПЯ фасетного типа по сравнению с ИПЯ иерархического типа состоит в том, что допускается многоаспектное индексирование, так как существует возможность строить классы из разных сочетаний фокусов и получать любые сочетания заранее выбранных характеристик объектов классификации. На практике иерархическая и фасетная классификация часто используются в сочетании. Например, УДК — универсальная десятичная классификация. Алфавитно-предметная классификация — система классов, каждый из которых соответствует определенной теме или одному виду предметов, причем классы расположены в алфавитном порядке имен этих классов. Основной словарный состав (лексика) ИПЯ состоит из упорядоченных по алфавиту множества слов, словосочетаний и фраз ЕЯ. Алфавитно-предметная классификация содержит: предметный заголовок — слово, словосочетание или фраза ЕЯ, используемое для обозначения предмета или темы, заголовок может подразделяться на подзаголовки; предметный словник (лексический состав языка) — упорядоченное по алфавиту множество предметных заголовков, используемых для построения алфавитно-предметной классификации; предметную рубрику — совокупность предметного заголовка с описанием адреса хранения документов, основная тема которых обозначается этим предметным заголовком. Алфавитно-предметная классификация предназначена для построения каталогов для узко предметного поиска. В таких каталогах под предметными заголовками даются сведения (шифр или библиографическое описание) документов, предмет которых обозначен данным заголовком. Порядок составления алфавитно-предметной классификации. 1. Анализ предметной области и выбор тем классификации. 2. Устранение синонимии слов, словосочетаний и фраз, используемых в качестве предметнрго заголовка. В случае синонимии можно использовать систему ссылок. 3. Выделение основных, ведущих слов в словосочетаниях и фразах, используемых в качестве предметных заголовков. Обозначение парадигматических связей между названиями предметов и тем. Эти связи обозначаются с помощью ссылок. Алфавитно-предметная классификация используется главным образом для информационного поиска по отдельным предметам и темам. И применяется в качестве предметных указателей к каталогам документов. Основной недостаток классификационных языков состоит в том, что они не обеспечивают возможности поиска документов по любому, заранее не заданному сочетанию признаков.
|