КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Олейник А.Г.
Базы данных. Реляционная модель данных: базовые понятия. Целостность БД. В 60-70 гг. существовала проблема: данные были привязаны к программе (встроены в программу, поэтому возникали след. проблемы: потеря, искажение информации→ ↑ объема обеспечения приводило к хаосу (неуправляемости)), → возникла идея оторвать данные от программы, поэтому и возникла теория БД. Неструктурирован-ть файловой с-мы. БД– спец. образом орг-ная(структурир-ая) сов-ть данных, предназ-ых для совместного использования при решении данного класса задач. Модель данных - совокупность правил порождения структур данных, баз данных, операций над ними, ограничений целостности и последовательности измерений. Исторически первые модели данных: иерархическая – представление данных в виде дерева, простота реализации; сетевая – раскладывается на иерархические (граф на деревья), она сложна логически, и. Сложный язык, но указывает связи и их структуру; реляционная исп-ся как теоретическая модель, требует больших ресурсов ЭВМ. Иерархическая: “+” наглядность, в любой модели можно выделить поддерево и способы описания будут одними и теми же. Легко модифицируется. “-” длинные пути. У каждого потомка единственный предок, объекты взаимосвязаны. Сетевая: нет ярко выраженной вершины – корня. Все связи представлены в явном виде. “-” кол-во связей для каждого узла м. б. разным. Если удаляем один узел, то корректировка остальных. Исп-ся там, где стр-ра данных не меняется. Каждый объект сам по себе никому не подчиняется. «-» иерах-й и сет: отсутствие единого мат аппарата, кот бы позволял описать мех-мы манипулирования с данными-> навигационный способ доступа Реляционная: состоит из набора отношений, вытеснила все остальные. Это есть представление пользователем этой БД в виде совокупности изменяемых во времени нормализованных отношений различных степеней. Три составные части СУБД: структурная позволяет описывать стр-ру Д; манипуляционная позв раб-ть со стр-рой; целостная(данные не д/б противоречивы). Кортеж отношения является аналогом строки таблицы. Атрибут отношения (поле, столбец) <Имя_атрибута : Имя_домена>-использование домена внутри отношенияИмена атрибутов должны быть уникальны в пределах отношения. Часто имена атрибутов отношения совпадают с именами соответствующих доменов. Домен - это семантическое понятие. Домен – это область допустимых значений некоторого атрибута. Домен характеризуется следующими свойствами: Имеется множество D1,D2,…Dn®декартовым произведением D1*D2*…*Dn На практике Домен = тип + огранич. Каждое множество Di – домен – это область допустимых значений атрибутов. N - степень отношения. Число кортежей (кол-во строк) – кардинальное число отношений(мин=0, мах=беск-ть). Реляц отнош наз-ся след стр-ра R(D1,D2,…Dn)= {<d1,d2,…dn>&P(d1,…,dn)=TRUE}.В отнош м. выделить 2 эл стр-р: 1. заголовок – перечень имен атрибутов. Заголовок {имя1:D1; имя2:D2…}, где Di – домен, т. е. полное мн-во значений, которые м. принимать данный атрибут. 2. тело- которое состоит из истинных картежей. Тело {<имя1=зн1; имя2=зн2;…>}.Тело это то, где хранится информация. Строки – записи, столбцы – поле (атрибуты). Реляц. онош. содержит только атомарный зн-я(не имеют внутр стр-ры)Для оперирования такой моделью и. мат. ап-т. Набор атрибутов, которые позволяют однозначно идентифицировать запись наз. ключом. Cв- ва: 1) уникальность 2) неизбыточность – если нельзя удалить ни 1 атрибута, чтобы это не привело к потери уникальности Целостность: Те атрибуты, кот. удовл. этим условиям наз. потенц. ключом. Реально выбирается 1 из них – он наз. первичным ключом. Внеш. Ключ- группа атр, кот обеспечивает связь атрибутов из разл групп. Мин. избыточность БД (управляемая) – неодходима для постр. (орг- ции) управления БД. Типы связей- 1:1(билет на самолет-пассажир), 1:много(один препод-студенты): много –много(ГОСЫ). Связи между табл. реал-ся с помощью внешних (ссылочных) ключей. Целостность БД: БД в любой момент времени содержит все данные, и данные должны быть не противоречивы. Целостность домена ≈ целостность атрибута (мгновенно). Целостность отношений включает: наличие ключа, атрибуты атомарные, бизнес-правила (опред-ся конкрет областью и работают под конкретную з-чу). Целостность БД: наличие внешних ключей, ссылочная целостность (отложенная). Целостность переходов определяется хранимыми процедурами, н-р если мужчина вдовец, то раннее он был женат, а не холост. [Каждое поле таблицы должно содержать скалярное значение (ограничение – не м.б. 2х одинаковых атрибутов). Атрибут определяется строго на одном домене. Ограничение внешнего ключа. Ограничение, определяемое предметной областью.] Манипуляционная часть: Осн упр-ия реляц. моделями явл. Реляционная алгебра, включ операции: 1) станд операции над мн-вами: объединение (union, объединяются объекты одного типа), пересечение (что есть и в 1ом и 2ом заголовках), вычитание (minus, что есть в 1ом, но нет во 2ом)) - только одинаковые заголовки, декартово произведение (заголовки разные, результат присоединения заголовков); 2) спец операции рел алгебры: проекции (выбор из отнош опред столбцов, заголовок – атрибуты, по которым строится проекция, тело – кортежи этих атрибутов из 1го отношения, но без повторов), выборка (where, выбрать из отношения кортежи, удовлетворяющие условию, т.е. выбрать строки из столбца), соединение (join, как декартово произведение, но по внешнему ключу как правило. Соединяются те кортежи, которые имеют одинаковые атрибуты). 3) деления, используется крайне редко (результат деления: отношение с заголовком, содерж. атрибуты R1, кот. не входят в заголовок R2, и телом, содержащим соответств. части кортежей отношения R1, т.ч. для каждого кортежа из R1 в R2 существует кортеж с соответствующими значениями). +примеры Все операции являются замкнутыми R=опер(R)- вх данные-отношения, вых-отношения Отличие РА от РИ: в РИ описыв-ся треб-ия, предъявляемые к рез-ту(SQL) Распределенные СУБД: FoxPro, oracle, Access “+”: 1. Сокращается избыточность данных (экономия). 2. Устраняется противоречивость (легче корректировать). 3. Возможность совместного use информации. 4. Возможность use стандартов. 5. ↑ безопасности данных. 6. Целостность данных (данные согласованы между собой). Все это обеспечивает независимость данных от приложений. Для пользователя видна логическая структура, а физическая структура скрыта.
|