КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Системы аналитической обработки данныхОсновной класс систем на уровне принятия тактических решений состоит из систем аналитической обработки данных в реальном времени (online analytical processing — OLAP). В отличие от оперативной обработки транзакций, которая, как правило, обеспечивает изменение данных, аналитическая обработка связана с анализом архивных данных при выработке правильных решений. Следовательно, вместо запроса детальных данных о продажах система аналитической обра- ботки данных в реальном времени попробует ответить на вопрос: "Какую прибыль получила компания в прошлом месяце в результате рекламной распродажи товаров, предназначенных для женщин, по сравнению с прибылью от обычных продаж в этом же месяце в прошлом году?" Чем больше архивных данных имеет компания, тем надежнее будет принятое решение. Системы аналитической обработки данных в реальном времени связаны с технологией управления хранилищами данных(data warehouse), которые обычно создаются с помощью накапливания последовательных копий данных, находящихся в одной или нескольких оперативных базах данных. Новые данные всегда добавляются в хранилище, а старые данные никогда оттуда не удаляются. Таким образом, хранилища данных быстро увеличиваются в размерах и становятся во много раз больше, чем исходные оперативные базы данных. Крупные хранилища измеряются в терабайтах (ТВ — 1012 байт) и даже петабайтах (РВ — 1015 байт). Размер хранилища данных представляет собой большую проблему, но, к счастью, эти данные являются статическими, т.е. не подвергаются изменениям (за исключением изменений, которые вносятся после обнаружения несогласованности, некорректности или неполноты данных). В соответствии с требованиями менеджеров, принимающих тактические решения, системы аналитической обработки данных в реальном времени должны поддерживать интенсивные запросы. Это условие предъявляет особые требования к технологиям управления хранилищами данных. С одной стороны, менеджерам необходима технология доступа к данным, не требующая программирования, с другой — хранилище данных должно обеспечивать легкий доступ к подробным архивным данным, разделенным, резюмированным и упакованным Резюмирование и упаковка данных представляет собой уникальную особенность хранилищ, предназначенных для обогащения данных, извлеченных из сторонних источников. Резюмирование (aggregation) подразумевает отбор, объединение и группировку данных, предназначенных для вычисления количественных показателей и трендов. Упаковка (packaging) подразумевает преобразование оперативных и резюмированных данных в более удобный формат, такой как графики, диаграммы, электронные формы и анимационные картинки. Для разделения (partitioning) информации используются технические средства и профильные данные о пользователях, позволяющие сократить объем данных, которые система должна просмотреть, чтобы ответить на запрос. Поскольку создание крупного и монолитного хранилища всех данных компании представляет собой серьезную проблему, для ее решения были предложены специальные технологии. В частности, весьма популярным практичным решением стали информационные лавки(data marts). Подобно хранилищам данных, информационные лавки — это специализированные базы данных, предназначенные для аналитической обработки. В отличие от хранилищ данных информационные лавки хранят лишь часть данных компании, касающуюся конкретного подразде- ления или отдельной производственной функции. Кроме того, информационные лавки в основном хранят резюмированные архивные данные, оставляя оперативные данные в исходных источниках. В последнее время все большую популярность получают Web-хранилища данных(data webhause), представляющие собой "распределенные хранилища данных, реализованные с помощью сети WWW и не имеющие центрального репозита-рия" (Connoly and Begg, 2005). Web-хранилища данных естественным образом устраняют сложности, связанные с извлечением, очисткой и загрузкой крупных объемов потенциально противоречивых данных из многих источников в одно место накопления данных. Web-хранилище предлагает альтернативную технологию для аналитической обработки в рамках внутренних промышленных сетей. Их потенциальное использование в Интернете ограничено требованиями конфиденциальности и безопасности данных, являющихся наиболее защищаемым стратегическим активом компании. За исключением этих ограничений Web-хранилища данных могут оказаться очень полезным инструментом анализа данных, характеризующих поведение пользователей Интернета (данные о переходах между Web-страницами (clickstreams)).
|