Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Технология хранилищ данных.




Концепция информационных хранилищ (первоначально они так и назывались – InformationWarehouse) зародилась в 80-х гг. в недрах корпорации IBM, но все же «отцом» технологии считается Билл Инмон, технический директор компании Prism. В 1992 г. Б. Инмон подробно описал данную концепцию в своей монографии «Построение хранилищ данных».

В основе концепции ХД лежит идея разделения данных, используемых для оперативной обработки и для решения задач анализа. Такое разделение позволяет оптимизировать как структуры данных для оперативных задач (операции ввода, модификации, удаления, поиска), так и структуры данных, используемые для анализа (выполнение аналитических запросов).

Билл Инмон в своей монографии дал определение ХД, ставшее классическим.

Хранилище данных – это предметно-ориентированный, интегрированный, неизменный, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений.

Наглядным способом представления особенностей нового объекта является сравнение его характеристик с характеристиками уже известного понятия или объекта. Традиционно, когда говорят о корпоративных информационных системах (КИС), упоминают термин «оперативная база данных». Под оперативной базой данных (ОБД) понимают базу данных транзакционных или OLTP-систем. Сравнение характеристик оперативной базы данных и хранилища данных позволяет не только понять их особенности, но и убедиться в том, что наличие ХД необходимо, если речь идет о решении задач анализа, прогноза, стратегического планирования.

 

 

Сравнение характеристик ОБД и ХД

Характеристика Требования к ОБД Требования к ХД
Степень детализации данных Хранение только детализированных данных Хранение как детализированных, так и агрегированных данных
Качество данных Возможны неверные данные из-за ошибок ввода Ошибки выявлены и устранены
Формат хранения данных Допускаются различающиеся форматы хранения данных Единый согласованный формат хранения данных
Структура хранения данных Нормализованная структура данных, минимизирующая вероятность возникновения ошибок при выполнении операций добавления, удаления, модификации данных Денормализованная структура данных, оптимизирующая скорость выполнения аналитических запросов
Управление данными Должна быть возможность в любое время добавлять, удалять, изменять данные Должна быть возможность периодически добавлять данные
Характер хранимых данных Хранятся только оперативные данные, представляющие текущую ситуацию Хранятся данные, накопленные за длительный промежуток времени
Характер запросов к данным Доступ к данным осуществляется по заранее определенным запросам Нерегламентированные, произвольные запросы
Время обработки запросов Время отклика системы измеряется в секундах Время отклика системы может составлять несколько минут
Характер вычислительной нагрузки Постоянная средняя загрузка процессора Загрузка процессора формируется только при выполнении аналитического запроса

 

Концептуально модель хранилища данных можно представить в виде схемы. Данные из различных источников помещаются в ХД, а описания этих данных в репозиторий метаданных. Конечный пользователь, используя различные инструменты (средства визуализации, построения отчетов, статистической обработки и т.д.) и содержимое репозитория, анализирует данные в хранилище. Результатом его деятельности является информация в виде готовых отчетов, найденных скрытых закономерностей, каких-либо прогнозов. Так как средства работы конечного пользователя с хранилищем данных могут быть самыми разнообразными, то теоретически их выбор не должен влиять на его структуру и функции его поддержания в актуальном состоянии.

 

Концептуальная модель хранилища данных

Информация
Метаданные
Метаданные
Оперативные системы
Внешние источники
Источники данных
Хранилище данных
Представление информации
Потребители информации
Репозитарий метаданных
Данные
Данные
Запрос
Структура Определение Размещение
Использование
Требование

Ортогональное планирование второго порядка (в планировании эксперимента).

Построение планов второго порядка – задача в математическом отношении значительно более сложная, чем в случае построения планов первого порядка. Модель второго порядка при m=3 имеет вид

.

Для вычисления коэффициентов модели второго порядка необходимо варьировать переменные не менее, чем на трех уровнях. Это вызывает необходимость постановки большого числа опытов. Полный факторный эксперимент содержит точек

m
композиц. план

 

Число точек плана равно величине .

Здесь n1- число точек полного факторного эксперимента 2mили дробной реплики 2m-n; 2m- число парных точек, расположенных на осях координат; - число опытов в центре плана. Расположение точек в факторном пространстве для композиционного плана Бокса-Уилсона в случае двух и трех входов показано на рисунке.

Точки на осях координат называют звёздными точками. Их количество равно удвоенному числу факторов. Расстояние от центра плана до звёздной точки одинаково. Его обозначают буквой α и называют звёздным плечом.

Описанные выше композиционные планы являются центральными планами, ибо все точки плана симметрично расположены относительно центра.

Композиционные планы имеют следующие положительные свойства.

3. Они могут быть получены в результате достройки планов первого порядка, поэтому их иногда называют последовательными планами. Это свойство позволяет при получении неадекватной модели первого порядка перейти к построению модели второго порядка, добавив опыты только в звёздных точках и в центре плана.

4. Дополнительные точки на осях координат и в центре плана (таблица) не нарушают ортогональности для столбцов, соответствующих факторам и эффектам взаимодействия . Этот факт открывает возможность независимого получения соответствующих коэффициентов модели.

 

n x0 x1 x2 x1x2
+ + + + + +
+ - + - + +
+ + - - + +
+ - - + + +
+
+ -
+
+ -
+


Ортогональность плана нарушается для столбцов и , ибо

Элементы вышеуказанных столбцов положительны. Чтобы получить полностью ортогональный план, необходимо произвести некоторое преобразование квадратичных переменных и специально выбрать величину α звёздного плеча.

Все элементы каждого столбца изменим на постоянную величину (среднее арифметическое):

Тогда новые столбцы ортогональны к :

Для выполнения условий ортогональности столбцов и

выберем соответствующую величину звёздного плеча α. Эта задача разрешима. В таблице приведены значения α, вычисленные для различного числа независимых переменных

m
Ядро планирования 22 23 24 25-1
Величина 1,000 1,215 1,414 1,547

 

С учётом новых переменных получаем следующее уравнение модели (для случая m=2):

Параметры в силу ортогональности плана вычисляются независимо, так же как и при использовании ортогонального плана первого порядка. Пересчитаем коэффициент

который оценивает сигнальную часть выхода объекта в центре плана.

 



Поделиться:

Дата добавления: 2015-04-18; просмотров: 84; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты