Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


МАЙСТРИ (WIZARDS)




У Deductor Studio вся робота ведеться за допомогою 5 майстрів:

1. Майстер імпорту.

2. Майстер експорту.

3. Майстер обробки.

4. Майстер візуалізації.

5. Майстер підключень.

 

За допомогою майстрів імпорту, експорту і обробки формується сценарій. Сценарій складається з вузлів (рис.2.3). Майстер підключень призначений для створення налаштувань підключень до різних джерел (баз даних чи сховищ даних) та одержувачів даних. Майстер візуалізації налаштовує візуалізатори для конкретного вузла.

Візуалізатором називається представлення набору даних в певному вигляді: табличному, графічному, описовому. Приклади візуалізаторів: таблиця, дерево, гістограма, діаграма, OLAP-куб тощо.

2.5. СЦЕНАРІЇ

 

В Deductor Studio для аналітика ключовим поняттям є сценарій.

Сценарій – це послідовність операцій з даними, представлену у вигляді ієрархічного дерева. В дереві кожна операція утворює вузол, заголовок якого містить:

· ім’я джерела даних;

· найменування методу обробки, використовувані при цьому поля тощо.

Крім цього, зліва від назви вузла розміщений значок, що відповідає типу операції (рис. 2.3).

Рис.2.3 Дерево сценаріїв

Deductor не має власних засобів для введення даних, тому сценарій завжди починається з вузла імпорту з певного джерела. Будь-який новостворений вузол імпорту знаходитиметься на верхньому рівні (підлеглий головному вузлу Сценарію).

Створення нового вузла імпорту здійснюється за допомогою Майстра імпорту. Викликати цей майстер можна наступними способами:

· кнопка на контекстній панелі інструментів;

· клавіша F6;

· контекстне меню – «Мастер Импорта».

В результаті виконання однієї з перелічених дій відкриється вікно, перший крок якого має наступний вигляд (рис. 2.4).

Рис.2.4. Перший крок «Мастера импорта»

 

Саме перший крок Майстра імпорту – вибір джерела даних – є найважливішим і від дій в ньому залежать всі подальші кроки цього майстра.

Варто відмітити, що у версії Academic, з якою ми працюємо, джерелом даних можуть виступати лише текстові файли або сховище даних Deductor.

В інших версіях програми таких обмежень нема і джерела можуть бути різноманітні (рис. 2.5).

Рис.2.5. Вікно імпорту у версіях Enterprise та Professional

 

Деякі категорії можуть бути відсутніми в списку. Причинами цього може бути:

· Версія Deductor.

· В дереві підключень (вкладка «Источники даних») не зареєстровано жодного об’єкту з даної категорії. Наприклад, якщо не настроєно жодного підключення до сховища даних, то категорія «Хранилища данных» буде відсутня.

· Відключена «видимість» об’єкту або категорії об’єкту (пункт «Вид – Параметры – закл. Доступные действия»).

Важливо відмітити, що при імпорті файлів є можливість використовувати як абсолютний ( ), так і відносний шлях для файлу ( ). Вони вказуються щодо поточної папки Deductor. При відкритті Deductor поточною папкою є папка файлу проекту. Тому, якщо файл проекту і файли імпорту розташовуються в одній директорії, то використання відносних шляхів в Майстрові імпорту дозволить не переналаштовувати вузли імпорту при зміні розташування папки на жорсткому диску.

Тому, запам’ятайте, що в подальшому потрібно ЗАВЖДИ вказувати відносний шлях до файлу (тобто потрібно стерти все, крім його імені).

До будь-якого вузла імпорту можна додати вузол обробки або вузол експорту, попередньо виділивши відповідний вузол імпорту. Новий вузол буде доданий як підлеглий до вузла імпорту (рис. 2.2). Створення нового вузла обробки здійснюється за допомогою Майстра обробки. Викликати майстер можна наступними способами:

· кнопка на контекстній панелі інструментів ;

· клавіша F7;

· контекстне меню – «Мастер обработки».

Зауважимо важливу особливість – Майстер обробки можна відкрити до будь-якого вузла імпорту чи іншої обробки і неможливо відкрити для вузла експорту.

Після виклику Майстра обробки відкриється вікно першого кроку майстра (рис. 2.6).

В ньому всі обробки згруповані по 4 наступним категоріям:

1. Очищення даних.

2. Трансформація даних.

3. Data Mining.

4. Інше.

Рис.2.6. Перший крок «Мастера обработки»

Варто відмітити, що до будь-якого сценарію можна застосувати Майстер візуалізації, який застосовується, як правило, для даних, що містяться в таблиці. Викликати Майстер візуалізації можна наступним чином:

1. Виділити вузол, для якого потрібно створити візуалізації.

2. Натиснути кнопку , або клавішу F5.

Логічним закінченням виконання сценарію є, як правило, експорт отриманих даних. Здійснюється це за допомогою відповідного майстра – Майстра експорту, викликати якого можна 3-ома способами:

· кнопка на контекстній панелі інструментів ;

· клавіша F8;

· контекстне меню – «Мастер экспорта».

В Deductor Academic експортувати (як і імпорутвати) дані можна в два формати: текстовий та у внутрішній формат сховища даних (рис. 2.7).

 

Рис.2.7. Експорт в академічній версії програми Deductor

 

Рис.2.8. Експорт у професійних версіях програми Deductor

 

!!!Важливо. Після вузла експорту неможливо додати жоден вузол!!!

 

2.6. БАЗОВІ ОПЕРАЦІЇ НАД ВУЗЛАМИ СЦЕНАРІЮ

Крім команд виклику Майстрів, до кожного вузла можна застосувати базові операції:

1. Відкриття вузла – вузол запускається на виконання, причому виконуються всі материнські вузли (які знаходяться вгорі), а справа відкриваються візуалізатори, настроєні для даного вузла. Для кожного вузла повинен бути налаштований хоча б один візуалізатор. Операція виконується ЛКМ2 по потрібному вузлу.

2. Налаштування вузла – викликається відповідний Майстер (Майстер імпорту, Майстер обробки або Майстер експорту залежно від типу вузла), для зміни параметрів вузла. Операція виконується: Alt+Enter, або «контекстне меню – Настроить», або кнопка .

3. Вирізання вузла – видаляє поточний вузол зі сценарію обробки. Всі його «нащадки» при цьому переміщаються на один рівень вгору і починають підкорятися «материнському вузлу» видаленого вузла. Операція виконується: «контекстне меню – Вырезать узел» або кнопка на контекстній панелі інструментів.

4. Вставити вузол – вставляє перед поточним вузлом сценарію новий вузол і викликає для нього Майстер обробки. Вставити вузол перед вузлом імпорту даних не можна. Операція виконується: «контекстне меню – Вставить узел» або кнопка . Після вставки нового вузла або видалення існуючого вузли-нащадки можуть стати неробочими, залежно від обробки, що виконується новим вузлом.

5. Копіювання гілки– копіює гілку сценарію починаючи від виділеного і включаючи всі його потомки. Операція виконується: «контекстне меню – Копировать ветвь», або кнопка , або перетягування мишкою (drag&drop).

6. Видалення гілки – видаляє вузол сценарію і всі його підвузли. Видалена гілка відновленню не підлягає, тому до даної операції необхідно підходити з обережністю. Операція виконується: Ctrl+Delete, або «контекстне меню – Удалить ветвь», або кнопка .

7. Перейменування – дозволяє змінити мітку (назву) поточного вузла. Операція виконується: F2 або «контекстне меню – Переименовать».

Працюючи в Deductor потрібно пам’ятати про ще одну зручну особливість – можливість отримати швидку статистику по масиву даних.

 

2.7.ЗАВДАННЯ ДЛЯ САМОСТІЙНОГО ВИКОНАННЯ

1. Імпортуйте текстовий файл «data.txt».

2. Створіть 5 вузлів фільтрації по наступним критеріям:

· Однокімнатні квартири.

· Двохкімнатні квартири.

· Трьохкімнатні квартири.

· Квартири в панельних будинках.

· Квартири в цегляних будинках з хорошим ремонтом (значення поля «2» та «3») та балконом.

3. Кінцевий вигляд вузлів зображено на рис.2.9.

Рис.2.9. Вузли сценарію

Зробіть наступне:

1. Виділіть вузол-імпорту

2. Через фільтрацію виведіть однокімнатні квартири з дуже хорошим ремонтом (значення поля «Ремонт» – 3).

Тепер припустимо, нам потрібно видко дізнатися таку інформацію по квартирах в цій вибірці:

1. Яка середня загальна площа квартир?

2. Яка максимальна та мінімальна площа кухні серед відібраних квартир?

3. На яких поверхах найбільше знаходиться квартир?

4. + інші подібні характеристики.

Таку інформацію можна отримати за допомогою: фільтрацією, обробника «Калькулятор», різних графіків, але є дещо простіший спосіб.

Для отримання відповіді на поставлені вище запитання слід зробити наступне:

1. Натискаємо на панелі інструментів кнопку .

2. Внизу з’являється панель.

3. Клацаємо по ній ПКМ і залишаємо поля, які в даний момент нам потрібні: «Гистограмма», «Минимум», «Максимум», «Среднее», «Сумма».

4. ЛКМ2 по гістограмі – повинна з’явитися панель праворуч.

 

Наступним завданням буде таке:

1. Створіть вибірку з двох- та трьохкімнатних квартир в цегляному будинку без ремонту (0) або майже без ремонту (1).

2. Виведіть статистику.

3. Дайте відповідь на питання на основі статистики:

a. У вибірці більше двох- чи трьохкімнатних квартир?

b. Яка середня площа кухні?

c. У вибірці більше квартир з ремонтом чи без?

d. Яка середня ціна на квартири у вибірці?

e. На якій вулиці найбільше квартир з вибірки?

 

3. ЗМІСТ ЗВІТУ

1. Титульний аркуш із вказанням номеру та назвою лабораторної роботи, особа що прийняла та виконала роботу;

2. Мета роботи;

3. Короткі теоретичні відомості;

4. Можливості платформу Deductor.

5. Особливості попередньої обробки даних.

6. Характеристика основних можливостей платформи.

7. Аналітичні висновки щодо властивостей платформи.

 

4. СПИСОК РЕКОМЕНДОВАНОЇ ЛІТЕРАТУРИ

 

1. Паклин Н.Б., Орешков В.И. Бизнес-аналитика: от данных к знаниям (+ СD). — СПб: Изд. Питер, 2009. — 624 с.

2. Дюк В., Самойленко А. Data Mining: учебный курс (+CD). — СПб: Изд. Питер, 2001. — 368 с.

3. Журавлёв Ю.И., Рязанов В.В., Сенько О.В. РАСПОЗНАВАНИЕ.Математические методы.Программная система. Практические применения — М.: Изд. «Фазис», 2006. — 176 с. — ISBN 5-7036-0106-8.

4. Зиновьев А. Ю. Визуализация многомерных данных — Красноярск: Изд. Красноярского государственного технического университета, 2000. — 180 с.

5. Чубукова И. А. Data Mining: учебное пособие — М.: Интернет-университет информационных технологий: БИНОМ: Лаборатория знаний, 2006. — 382 с. — ISBN 5-9556-0064-7.

6. Айвазян С. А., Бухштабер В. М., Юнюков И. С., Мешалкин Л. Д. Прикладная статистика: Классификация и снижение размерности. - М.: Финансы и статистика, 1989.

7. Knowledge Discovery Through Data Mining: What Is Knowledge Discovery? - Tandem Computers Inc., 1996.

8. Кречетов Н.. Продукты для интеллектуального анализа данных. - Рынок программных средств, N14-15_97, c. 32-39.

9. Boulding K. E. General Systems Theory - The Skeleton of Science//Management Science, 2, 1956.

10. Гик Дж., ван. Прикладная общая теория систем. - М.: Мир, 1981.

11. Киселев М., Соломатин Е.. Средства добычи знаний в бизнесе и финансах. - Открытые системы, № 4, 1997, с. 41-44.

12. Дюк В.А. Обработка данных на ПК в примерах. - СПб: Питер, 1997.


Поделиться:

Дата добавления: 2015-05-08; просмотров: 73; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты