КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Хранение и накопление информации. Характеристика уровней и моделей представления данных предметной области при хранении
Хранение и накопление являются одними из основных действий, осуществляемых над информацией и главным средством обеспечения ее доступности в течение некоторого промежутка времени. В настоящее время определяющим направлением реализации этой операции является концепция базы данных и склада (хранилища) данных. База данных может быть определена как совокупность взаимосвязанных данных, используемых несколькими пользователями и хранящихся с регулируемой избыточностью. Хранимые данные не зависят от программ пользователей, для модификации и внесения изменений применяется общий управляющий метод. Банк данных – система, представляющая определенные услуги по хранению и поиску данных определенной группе пользователей по определенной тематике. Система баз данных – совокупность управляющей системы, прикладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей. Хранилище данных (используют также термины Data Warehouse, «склад данных», «информационное хранилище») – это база, хранящая данные, агрегированные по многим измерениям. Основные отличия хранилища данных от базы: агрегирование данных; данные из хранилища никогда не удаляются; пополнение хранилища происходит на периодической основе; формирование новых агрегатов данных, зависящих от старых, – автоматическое. Альтернативой хранилищу данных является концепция витрин данных (Data Mart). Витрины данных – множество тематических баз данных, содержащих информацию, относящуюся к отдельным информационным аспектам предметной области. По отношению к пользователям применяют трехуровневое представление для описания предметной области: концептуальное, логическое и внутреннее (физическое) (рисунок).
СУБД – система управления базами данных; МБД – машина баз данных (вспомогательный периферийный процессор, выполняющий функции СУБД и необходимый вследствие возросших объемов информации и требований к скорости доступа) Рисунок – Описание предметной области
Концептуальный уровень связан с частным представлением данных группы пользователей в виде внешней схемы, объединяемых общностью используемой информации. Каждый конкретный пользователь работает с частью базы данных и представляет ее в виде внешней модели. Этот уровень характеризуется разнообразием используемых моделей (модель «сущность–связь» (ER-модель (диаграмма), модель Чена), инфологические модели, семантические сети). На рисунке представлена концептуальная модель (модель «сущность–связь») для описания данных химико-технологического процесса (процесса спекания керамических материалов).
Рисунок – Модель «сущность–связь» для описания данных химико-технологического процесса
Логический уровень является обобщенным представлением данных всех пользователей в абстрактной форме. Используются следующие виды даталогических моделей: иерархические, сетевые, реляционные, объектно-ориентированные, объектно-реляционные. Сетевая модель является моделью объектов-связей, допускающей только бинарные связи «многие-к-одному» и использует для описания модель ориентированных графов. Иерархическая модель является разновидностью сетевой, являющейся совокупностью деревьев (лесом). Реляционная модель использует представление данных в виде таблиц (реляций), она базируется на реляционной алгебре и теории отношений. В ней сущность предметной области примерно соответствует таблице, а атрибут сущности – полю (столбцу) таблицы. На рисунке представлена реляционная модель базы данных химико-технологического процесса (процесса спекания керамических материалов).
Рисунок – Реляционная модель базы данных химико-технологического процесса
В объектно-ориентированной модели используются понятия класса, объекта, метода. Данные называются свойствами класса, а алгоритмы – методами. Начало работы класса задается с помощью специальных внутренних (например, нажатие кнопки) или внешних (вызов из другой программы) сигналов, называемых событиями. Для построения объектно-ориентированной модели необходимо: провести инкапсуляцию данных, т.е. выделить классы и объекты; определить возможные виды структуры таблиц; создать наследование классов данных (трансформацию классов путем изменения свойств и методов); обеспечить полиморфизм (возможность использования метода с одним именем как в базовом, так и в производных классах). Физический (внутренний) уровень связан со способом фактического хранения данных в физической памяти ЭВМ. Основными компонентами физического уровня являются хранимые записи, объединяемые в блоки; указатели, необходимые для поиска данных; данные переполнения; промежутки между блоками; служебная информация. Конкретная реализация системы баз данных, с одной стороны, определяется спецификой данных предметной области, отраженной в концептуальной модели, а, с другой стороны, – типом конкретной СУБД, устанавливающей логическую и физическую организацию. Основные стандарты СУБД: • независимость данных на концептуальном, логическом, физическом уровнях; • универсальность (по отношению к концептуальному и логическому уровням, типу ЭВМ); • совместимость, неизбыточность данных; • безопасность и целостность данных; • актуальность и управляемость. Критерии оценки баз данных принято делить на количественные и качественные. Количественные критерии: время, необходимое для ответа на запрос, стоимость модификации, стоимость памяти, время на создание, стоимость на реорганизацию. Качественные критерии: гибкость, адаптивность, доступность для новых пользователей, совместимость с другими системами, возможность конвертирования в другую вычислительную среду, возможность восстановления, возможность распределения и расширения. Трудность в оценке проектов баз данных связана с различной чувствительностью и временем действия критериев. Например, критерий эффективности обычно является краткосрочным и чрезвычайно чувствительным к проводимыми изменениям, а такие понятия, как адаптируемость и конвертируемость, проявляются на длительных временных интервалах и менее чувствительны к воздействию внешней среды. Основные направления научных исследований в области баз данных: • развитие теории реляционных баз данных; • моделирование данных и разработка конкретных моделей разнообразного назначения; • создание СУБД с мультимодельным внешним уровнем, обеспечивающих возможности отображения широко распространенных моделей; • разработка, выбор и оценка методов доступа; • создание самоописываемых баз данных, позволяющих применять единые методы доступа для данных и метаданных; • управление конкурентным доступом; • развитие системы программирования баз данных, которые обеспечивали бы единую эффективную среду как для разработки приложений, так и для управления данными; • совершенствование машин баз данных; • разработка дедуктивных баз данных, основанных на применении аппарата математической логики и средств логического программирования, а также пространственно-временных баз данных; • интеграция неоднородных информационных ресурсов.
|