Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Системы аналитической обработки данных




Основной класс систем на уровне принятия тактических решений состоит из систем аналитической обработки данных в реальном времени (online analytical processing — OLAP). В отличие от оперативной обработки транзакций, которая, как правило, обеспечивает изменение данных, аналитическая обработка связана с анализом архивных данных при выработке правильных решений. Следователь­но, вместо запроса детальных данных о продажах система аналитической обра-


ботки данных в реальном времени попробует ответить на вопрос: "Какую при­быль получила компания в прошлом месяце в результате рекламной распродажи товаров, предназначенных для женщин, по сравнению с прибылью от обычных продаж в этом же месяце в прошлом году?" Чем больше архивных данных имеет компания, тем надежнее будет принятое решение.

Системы аналитической обработки данных в реальном времени связаны с технологией управления хранилищами данных(data warehouse), которые обыч­но создаются с помощью накапливания последовательных копий данных, находя­щихся в одной или нескольких оперативных базах данных. Новые данные всегда добавляются в хранилище, а старые данные никогда оттуда не удаляются. Таким образом, хранилища данных быстро увеличиваются в размерах и становятся во много раз больше, чем исходные оперативные базы данных. Крупные хранилища измеряются в терабайтах (ТВ — 1012 байт) и даже петабайтах (РВ — 1015 байт). Размер хранилища данных представляет собой большую проблему, но, к счастью, эти данные являются статическими, т.е. не подвергаются изменениям (за исклю­чением изменений, которые вносятся после обнаружения несогласованности, не­корректности или неполноты данных).

В соответствии с требованиями менеджеров, принимающих тактические ре­шения, системы аналитической обработки данных в реальном времени должны поддерживать интенсивные запросы. Это условие предъявляет особые требова­ния к технологиям управления хранилищами данных. С одной стороны, менедже­рам необходима технология доступа к данным, не требующая программирования, с другой — хранилище данных должно обеспечивать легкий доступ к подробным архивным данным, разделенным, резюмированным и упакованным

Резюмирование и упаковка данных представляет собой уникальную особен­ность хранилищ, предназначенных для обогащения данных, извлеченных из сто­ронних источников. Резюмирование (aggregation) подразумевает отбор, объеди­нение и группировку данных, предназначенных для вычисления количественных показателей и трендов. Упаковка (packaging) подразумевает преобразование опе­ративных и резюмированных данных в более удобный формат, такой как графи­ки, диаграммы, электронные формы и анимационные картинки. Для разделения (partitioning) информации используются технические средства и профильные данные о пользователях, позволяющие сократить объем данных, которые система должна просмотреть, чтобы ответить на запрос.

Поскольку создание крупного и монолитного хранилища всех данных компа­нии представляет собой серьезную проблему, для ее решения были предложены специальные технологии. В частности, весьма популярным практичным решени­ем стали информационные лавки(data marts). Подобно хранилищам данных, ин­формационные лавки — это специализированные базы данных, предназначенные для аналитической обработки. В отличие от хранилищ данных информационные лавки хранят лишь часть данных компании, касающуюся конкретного подразде-


ления или отдельной производственной функции. Кроме того, информационные лавки в основном хранят резюмированные архивные данные, оставляя оператив­ные данные в исходных источниках.

В последнее время все большую популярность получают Web-хранилища дан­ных(data webhause), представляющие собой "распределенные хранилища данных, реализованные с помощью сети WWW и не имеющие центрального репозита-рия" (Connoly and Begg, 2005). Web-хранилища данных естественным образом устраняют сложности, связанные с извлечением, очисткой и загрузкой крупных объемов потенциально противоречивых данных из многих источников в одно место накопления данных. Web-хранилище предлагает альтернативную техноло­гию для аналитической обработки в рамках внутренних промышленных сетей. Их потенциальное использование в Интернете ограничено требованиями конфиден­циальности и безопасности данных, являющихся наиболее защищаемым страте­гическим активом компании. За исключением этих ограничений Web-хранилища данных могут оказаться очень полезным инструментом анализа данных, характе­ризующих поведение пользователей Интернета (данные о переходах между Web-страницами (clickstreams)).


Поделиться:

Дата добавления: 2015-08-05; просмотров: 67; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты