КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Поняття бази даних та бази знаньПоняття "база даних" (БД) означає сукупність даних, призначених для спільного використання. База даних — сукупність спеціальним чином організованих даних і об’єктів, що відображають стан і їхні взаємозв’язки у предметній області. Під предметною областю прийнято розуміти частину реального світу, який підлягає вивченню для організації управління і в кінцевому рахунку автоматизації, наприклад, ВУЗ, підприємство. Розрізняють документальну БД (сукупність текстових документів вільних форматів) і фактографічну БД (сукупність відомостей, що зберігаються в інформаційній системі й організованих відповідно до вимог якого-небудь фіксованого набору форматів). Дані, збережені в документальних і фактографічних БД, поміщаються в сховища, модифікуються і використовуються. На всіх етапах життєвого циклу БД складається з двох компонентів: структури та даних. Під структуризацією розуміється введення угод про способи представлення даних. Неструктурованими можуть вважатися дані у текстовому файлі. Прикладом структурованих даних може виступати таблиця. Логічну структуру даних, що зберігаються у базі даних, називають моделлю представлення даних. На різних рівнях абстракції опису БД її структура зображується по-різному, як показано на Рис. 5.1.1. На концептуальному інфологічному рівні структура БД ефективно відображається у вигляді ER-діаграми — діаграми "Entity — Relationship" ("Сутність — зв'язок"), запропонованої у 1976 p. П. Ченом; на концептуальному даталогічному рівні вона є або ієрархічною, або мережною, або реляційною, або об'єктно-орієнтованою, або об'єктно-реляційною, або багатовимірною, або гібридною моделлю даних. На фізичному рівні структура БД — це структура файлів даних і допоміжних файлів.
Рис. 5.1.1. Складові БД та файла даних у реляційній БД
Самі файли даних також складаються з двох компонентів: структури та даних. Структура файла в реляційній моделі (Рис. 8) — це ім'я, тип поля, його довжина, точність (для числових полів). Розробленням структури БД на всіх етапах займається Системний аналітик, який забезпечує БД усіма необхідними властивостями. Дані — це компонент БД, яким маніпулює користувач ІС, актуалізуючи БД. Дані сучасних БД поділяються на: — алфавітно-цифрові (використовуються практично в усіх ІС); — графічні образи (застосовуються в різних системах автоматизованого проектування (САПР)); — гіпертекстові, гіпермедійні, мультимедійні (використовуються в ІС на основі технологій Internet/Intra-net/Extranet); — просторові або картографічні (застосовуються в геоінформаційних системах); — ряди даних (як правило, хронологічні ряди, що використовуються у багатовимірних БД, які становлять основу сховищ даних). База даних містить словник мета даних, що сам по собі є БД, де розміщені дані про дані, тобто інформація про саму БД, і є інструментом адміністратора БД. У словнику корисно мати такі дані: ім'я, тип, довжину, точність, допустимі значення кожного елемента даних; назви файлів даних і допоміжних файлів, що забезпечують доступ до даних; адреси цих файлів, кількість записів, які зберігаються (мають формуватися автоматично при роботі з даними); дати реєстрації змін у структурах даних (теж мають формуватися автоматично); дані про адміністраторів, які керують файлами, та іншу інформацію. Система управління БД разом з обчислювальною системою та словником БД є інструментальним засобом розроблення та супроводу БД. Адміністратор БД — особа або група осіб, які відповідають за загальне керування БД. До обов'язків адміністратора БД належать: вироблення вимог до БД, її проектування, створення, ефективне використання і супровід, визначення інформаційного змісту БД, структури зберігання та стратегії доступу, взаємодія з користувачами, визначення контролю повноважень і процедур перевірки вірогідності даних, а також стратегії відновлення даних, керування ефективністю БД. У процесі експлуатації АБД звичайно стежить за функціонуванням інформаційної системи, забезпечує захист від несанкціонованого доступу, контролює надмірність, несуперечність, схоронність і вірогідність збереженої в БД інформації. Для однокористувальницьких інформаційних систем функції АБД звичайно покладаються на осіб, що безпосередньо працюють з додатком БД. В обчислювальній мережі АБД, як правило, взаємодіє з адміністратором мережі. В обов'язку останнього входять контроль за функціонуванням апаратно-програмних засобів мережі, реконфігурація мережі, відновлення програмного забезпечення після збоїв і відмовлень устаткування, профілактичні заходи і забезпечення розмежування доступу. Обслуговуючий персонал виконує функції підтримки технічних і програмних засобів у працездатному стані. Він проводить профілактичні, регламентні, ремонтні й інші планові роботи, а також роботи по мірі необхідності. Додаток являє собою чи програму комплекс програм, що забезпечують автоматизацію обробки інформації для прикладної задачі. Додатки можуть створюватися в або у середовищі, або поза середовищем СУБД — за допомогою системи програмування, що використовує засобу доступу до БД, наприклад Delphi, C++, Builder. Додатки, розроблені в середовищі СУБД, часто називають додатками СУБД, а додатки, розроблені поза СУБД, — зовнішніми додатками. Для роботи з базою даних найчастіше досить засобів СУБД і не потрібно використовувати додатки, створення яких вимагає програмування. Додатки розробляють головним чином у випадках, коли потрібно забезпечити зручність роботи з БД некваліфікованим користувачам або коли інтерфейс СУБД не влаштовує користувачів. База знань — упорядкована сукупність спеціальним чином організованих правил і фактів, що відображають їхній стан і взаємозв’язки у предметній області, механізмів виведення та програмних засобів, та призначена для подання нагромаджених у ній знань. База знань широко використовується в автоматизованих експертних системах для вирішення експертних завдань за допомогою правил логічного виведення. Знання – це особлива форма інформації, яка представляє собою сукупність структурованих теоретичних і емпіричних положень предметної області, які представлені у різній формі, мають певні властивості, пов’язані синтаксичними, семантичними, прагматичними відносинами і дозволяють розв’язувати прикладні задачі. Знання існують у наступних формах: у пам’яті людини (експерта); матеріалізовані або канонізовані знання у підручниках, наукових монографіях тощо та розташовані на різних матеріальних носіях; напівформалізована структурована модель у вигляді “поля знань”; формалізовані знання на деякій мові представлень і БЗ. Процедура створення БЗ може мати наступний вигляд (рис. 5.1.2):
Рис. 5.1.2. Процедура створення БЗ.
Сховище (склад, банк даних (БнД)) даних (англ. data warehouse) — предметно–орієнтований, інтегрований, незмінний набір даних, що підтримує хронологію і здатний бути комплексним джерелом достовірної інформації для оперативного аналізу та прийняття рішень. Сховища даних можна представити наступним чином: Рис.5.1.3. Описи баз даних відносяться до метаінформації, тобто інформації про інформацію. Опис баз даних часто називають схемою. Крім того, в сховищі даних можуть бути присутніми описи окремих частин баз даних, з погляду окремих користувачів — підсхеми. Централізоване сховище метаінформації називається словником даних. Окрім опису баз даних, до складу метаінформації може включатися інформація про предметну область, яка необхідна для проектування системи, про користувачів сховища даних, про проектні рішення і деяка інша інформація.
|