Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Аксіома 1: Розвиток (еволюція) системи визначається деякою ціллю й інформаційними ресурсами системи, її інформаційною відкритістю.




Аксіома 2: При прагненні до цілі система сприймає вхідну інформацію, що використовується і для зміни внутрішньої структури самої системи, внутрішньої системної інформації.

Аксіома 3: Зміна внутрішньої системної інформації відбувається так, щоб відбувалось збільшення інформативності і зменшення ентропії (міра безладдя) у системі.

Аксіома 4: Будь-яка зміна внутрішньої структури системи чи внутрішньої інформації впливає на вихідну інформацію системи (тобто на навколишнє середовище системи); внутрішня ентропія змінює зовнішню ентропію системи.

7.9. Інформаційні комп'ютерні системи аналізу даних

Інформаційні комп'ютерні системи для аналізу даних - це наукомісткі програмні продукти, які широко застосовуються у дослідницькій і практичній роботі в найрізноманітніших областях сучасного суспільства.

Сучасний світовий і вітчизняний ринок характеризується різномастістю комп’ютерних систем та статистичних програмних продуктів (СПП), за офіційними даними Міжнародного статистичного інституту, число найменувань СПП наближається до тисячі (Statistica; SAS; Statgraphics+; Minitab; Systat; S-Plus; Клас-Майстер, Stadia; PolyAnalyst, ...).

Пакети програм статистичного аналізу можна поділяти на чотири групи:

q інтегровані метода-орієнтовані пакети загального призначення;

q спеціалізовані метода-орієнтовані пакети;

q предметно - (чи проблемна -) орієнтовані пакети;

q навчальні програми.

Якість СПП визначає:

q вхідна мова пакета;

q статистична різноманітність;

q керування даними;

q графіка;

q швидкість обчислень;

q якість вихідних форм;

q легкість використання;

q легкість навчання;

q ступінь інтелектуальності пакета.

Вхідна мова пакета - проблемно-орієнтована неалгоритмічна мова високого рівня, що дозволяє формулювати завдання. Мова пакету поділяється на дві частини: мова адміністратора і мова користувача.

Статистична різноманітність - це повнота і якість реалізованих у пакеті моделей і методів.

Керування даними містить у собі експорт/імпорт, перетворення, реструктуризацію даних, а також інші додаткові можливості. В залежності від реалізованих у пакеті можливостей керування даними, ті чи інші перетворення можуть виконуватися в одних випадках досить швидко, а в інших украй повільно (а іноді деякі перетворення просто неможливі).

Графіка є важливим компонентом потужності СПП. Велике значення надається розвиненості графічних засобів, наявності графіків і карт аналітичного характеру, можливостям виводити результати дослідження на друкувальні пристрої.

Швидкість обчислення результатів є важливою властивістю для комфортної експлуатації і помітно зменшує число комп’ютерів, необхідних для вирішення поставлених задач.

Придатність вихідних форм впливає на якість звітів, статей і презентацій. Тут враховуються і додаткові графічні можливості: наявність логарифмічних шкал, показ окремих крапок графіка, друк графіків на одній сторінці з даними, накладення графіків один на одного і наявність вбудованого графічного редактора.

Легкість навчання СПП пов’язана з його освоєнням. В якісному СПП завжди існує документації з експлуатації, посібник з методів реалізованих у пакеті типу "Керівництво користувача".

Легкість використання залежить від зручності інтерфейсу, якості побудови довідкової системи, якості таблиць, графіків та ін.

Ступінь інтелектуальності пакета в першу чергу припускає організацію такого режиму роботи СПП, при якому користувач має досить кваліфіковану розвинену систему комп'ютерної консультаційної підтримки (по статистиці), що охоплює різні стадії вирішення задачі:

- орієнтування користувача щодо літературних джерелах присвячених статистичним методам, забезпечення підказками з термінології та понять;

- допомога в постановці задачі, докладний попередній аналіз вихідних даних з акцентуванням уваги користувача на їхньому генезисі й особливостях;

- підбір придатного виду моделі і технологічного ланцюжка модулів обробки;

- опис набору типових статистичних "пасток" і способів, їх уникнення;

- допомога в інтерпретації проміжних і фінальних результатів статистичного аналізу;

- пропозиції напрямків подальшого дослідження.

Вміння грамотно підібрати та використовувати програмне забезпечення надає можливість досліднику не витрачати час на рутинні і складні підрахунки, а зосередитись на аналітичній роботі.

7.10. Загальна організація інструментарію пакетів прикладних програм

Для будь-якої групи СПП інструментарій організований у вигляді окремих бібліотек модулів. Кожна з бібліотек містить модулі обробки даних чи їхні групи, що реалізують функції СПП.

Бібліотека 1 - допоміжні програми. Вона тематично розділяється на три розділи:

- методи матричної алгебри;

- алгоритми оптимізації;

- статистичне моделювання на персональному комп’ютері.

 

Бібліотека 2- описова статистика і розвідницький аналіз даних. Зміст бібліотеки визначається основними задачами первинної статистичної обробки даних.

Бібліотека 3 - статистичне дослідження залежностей. Вона тематично розділяється на шість розділів:

- кореляційно-регресійний аналіз;

- дисперсійний і коваріаційний аналіз;

- системи одночасних структурних економетричних рівнянь;

- планування регресійних експериментів і вибіркових досліджень;

- аналіз тимчасових рядів;

- аналіз залежностей марківського типу.

 

Бібліотека 4 - класифікація і зниження розмірності. Вона тематично розділяється на п’ять розділів:

- дискримінантний аналіз;

- статистичний аналіз розподілів;

- кластерний аналіз (таксономія);

- зниження розмірності відповідно до критерію автоінформативності (без навчання);

- зниження розмірності відповідно до критерію зовнішньої інформативності (при наявності навчання).

 

Бібліотека 5 - методи статистичного аналізу нечислової інформації та експертних оцінок. У складі використовуваного в ній математико-статистичного інструментарію: робота з нечіткими множинами, суб'єктивними ймовірностями, ранговими методами і т.п.

 

Бібліотека 6 - планування експерименту і вибіркових обстежень.

Крім перерахованих шести бібліотек у склад СПП входить ряд керуючих модулів і програм: організуюча програма (програма-адміністратор), сервісна програма, бібліотека паспортів модулів таблиця семантичної моделі.

Інформація, що використовується СПП, поділяється на три типи:

- керуюча;

- оброблювана;

- термінологічна.

Керуючу інформаціюзадає користувач. Вона містить опис типу оброблюваних даних, метод обробки, тип моделі, вимоги до настроювання програми й ін.

Оброблювана інформаціяскладається вхідних і вихідних даних (наприклад, параметрів регресійних рівнянь, правил класифікації, моделей зниження розмірності).

Термінологічна інформація - це словник найменувань, прийнятих в області досліджень. Використання цієї інформації дозволяє провести налаштування пакету і роздрукувати вихідні дані у термінах області дослідження.

7.11. Електронні таблиці в системному аналізі даних

У повсякденній діяльності для проведення системного аналізу буває цілком достатньо набору інструментів, що пропонують електронні таблиці.

Термін електронна таблиця застосовується для позначення простої у використанні комп'ютерної програми, призначеної для обробки даних, яка містить у собі:

- проведення різноманітних обчислень з використанням потужного апарату функцій і формул;

- дослідження впливу різноманітних чинників на дані;

- рішення задач оптимізації;

- одержання вибірки даних;

- побудова графіків і діаграм;

- статистичний аналіз даних.

Найбільше поширення в Україні одержав табличний процесор Мicrosoft Ехсеl, який є складовою офісного пакету Мicrosoft Office. Excel є простою в експлуатації та в той же час, досить потужною системою електронних таблиць.

В Excel існує дуже зручна для використання довідкова система. Викликати довідкову систему можна за допомогою натискання мишею знака ? з основного меню, пункт "Вызов справки".Крім того, вікно діалогу багатьох команд має кнопку "Справка", при натисканні якої Excel надає інформацію про те, як користуватися цим вікном діалогу. Також існує кнопка "Справка", що розташована на панелі інструментів "Стандартная", вона додає до курсору миші знак питання (?), після чого інформацію про команди та елементи екрана можна одержати, якщо встановити в потрібне місце покажчик миші зі знаком питання і натиснути ліву кнопку миші.

Основним елементом електронної таблиці Excel є наявність потужного апарата формул і функцій. Будь-яке опрацювання даних у Excel здійснюється за допомогою цього апарата. Завдяки йому можна складати, множити, ділити числа, добувати квадратні корені, знаходити синуси і косинуси, логарифми та експоненти. Крім обчислення окремих значень, можна опрацьовувати окремі рядки або стовпчики таблиці, а також цілі блоки комірок. Зокрема, знаходити середнє арифметичне, максимальне і мінімальне значення, середнє - квадратичне відхилення, найбільше ймовірне значення, довірчий інтервал та ін.

Функції в Excel використовуються для виконання стандартних обчислень у робочих книгах. Значення, що використовуються для обчислення функцій, називаються аргументами. Значення, що повертаються функціями в якості відповіді, називаються результатами. Крім умонтованих функцій можна використовувати в обчисленнях функції, що створюються користувачем за допомогою засобів Excel.

Щоб використовувати функцію, потрібно ввести її, як частину формули, в комірку робочого аркуша. Послідовність, у якій повинні розташовуватися символи у формулі, називається синтаксисом функції. Всі функції використовують однакові основні правила синтаксису. Функція завжди починається зі знака рівності, як і всяка формула. Аргументи функції записуються в круглих дужках відразу за назвою функції і відокремлюються один від одного символом ";". Дужки дозволяють Excel визначити де починається і де закінчується список аргументів. Усередині дужок повинні розташовуватися аргументи. При записі функції не варто вставляти пробіли між назвою функції і дужками. Якщо правила синтаксису порушені, Excel видає повідомлення про те, що у формулі є помилка.

У якості аргументів можна використовувати числа, текст, логічні значення, масиви, значення помилок або посилання. Аргументи можуть бути як константами так і формулами. У свою чергу ці формули можуть містити інші функції. Функції, які є аргументом іншої функції, називаються вкладеними. У формулах Excel можна використовувати до семи рівнів функцій.

Excel містить більш 400 умонтованих функцій. Тому безпосереднього вводити з клавіатури у формулу назви функцій і значення вхідних параметрів не завжди зручно. В Excel є спеціальний засіб для роботи з функціями - "Мастер функций". При роботі з цим засобом спочатку пропонується вибрати потрібну функцію зі списку категорій, а потім у вікні діалогу увести вхідні значення.

Для зручності функції в Excel розбиті за категоріями: статистичні, текстові, математичні, функції керування базами даних і списками, функції дати і часу, DDE/Зовнішні функціїінженерні функції, фінансовіінформаційні, логічні, функції перегляду і посилань.

Для проведення статистичної обробки інформації табличний процесор Excel містить у собі бібліотеку з 78 статистичних функцій, які призначенні для вирішення наступних задач:

- визначення числових характеристик;

- генерування рядів значень, що відповідають певному закону;

- статистичне оцінювання міри відповідності;

- елементарний аналіз;

- прогнозування;

- допоміжні функції.

Стандартні (вбудовані) функції Excel дозволяють визначити чисельні характеристики. Стандартні (вбудовані) функції Excel дозволяють генерувати ряди даних за майже 20 законами розподілу: біноміальний; Вейбулла; від’ємний біноміальний; гама – розподіл (інтегральна функція і обернена інтегральна функція); гіпергеометричний; логарифмічний нормальний (інтегральна функція і обернена інтегральна функція); нормальний (інтегральна функція і обернена інтегральна функція); Пуассона; стандартний нормальний (інтегральна функція і обернена інтегральна функція); Ст’юдента (інтегральна функція і обернена інтегральна функція); хі-квадрат (інтегральна функція і обернена інтегральна функція); експоненціальний; F- розподіл (інтегральна функція і обернена інтегральна функція).

До складу Excel входить набір засобів аналізу даних - "Пакет аналізу", призначений для рішення складних статистичних і інженерних задач. Пакет аналізу містить наступні інструменти:

- однофакторний дисперсійний аналіз;

- двофакторний дисперсійний аналіз з повтореннями;

- двофакторний дисперсійний аналіз без повторень;

- кореляція;

- ковариація;

- описова статистика;

- експоненціальне згладжування;

- двовибірковий F-тест для дисперсій;

- аналіз Фур'є;

- гістограма;

- ковзне середнє;

- генерація випадкових чисел;

- ранг;

- регресія;

- вибірка;

- парний вибірковий t-тест для середніх;

- двовибірковий t-тест з однаковими дисперсіями;

- двовибірковий t-тест з різними дисперсіями;

- двовибірковий z-тест для середніх.

Електронні таблиці мають менш потужний арсенал ніж СПП, але і його буває достатньо для автоматизації та спрощення роботи аналітика.

Питання для самоконтролю

1. Класифікувати інформацію за різних ознаках.

2. Визначити основні режими актуалізації інформації в системі.

3. Охарактеризувати поняття: "факт", "знання", "відомості" та "дані"

4. Охарактеризувати поняття "інформація" та "інформаційний ресурс".

5. Охарактеризувати документ, як інформаційний ресурс, визначити основну функцію документу в системі міжнародних відносин.

6. Визначити основні класи інформаційних ресурсів.

7. Проаналізувати термін “актуалізація інформації”. Навести приклад актуалізованої і не актуалізованої інформації.

8. Охарактеризувати одиниці виміру повідомлення та інформації.

9. Визначити суть задачі інформаційного керування системою. Навести приклади.

10. Проаналізувати комп'ютерні системи для аналізу даних.

Типовий приклад

Мета дослідження: ознайомитись з базовими поняттями прийняття інформаційних рішень в системі міжнародних відносин. Оволодіти навичками аналізу документів.

Задача дослідження: провести аналіз документу.

Рішення задачі:

документ може розглядатися як кортеж:

D=<Z, N, A, F, T, P, M>, де:

Z - зміст інформації: складається з проблемної області інформації, відображеної в документі (науково-технічна, економічна, управлінська, технологічна, виробнича, юридична, довідкова, соціальна, медична, інша, у тому числі: художня, релігійна, музична, літературна і т.д.).

N - носій інформації:

Паперовий носій: традиційні засоби поліграфії, носії типу "принтер", перфострічки, перфокарти, носії для пристроїв відображення.

Магнітні і магнітооптичні носії: магнітні стрічки, магнітні диски і дискети, жорсткі диски (вінчестери), CD-ROM, оперативна пам'ять.

Мікрофільмові носії і кінофотоматеріали: мікрофільми, фотоносії, кіноматеріали.

Пристрої відображення: табло для алфавітно-цифрової інформації, екрани.

A - алфавіт представленої інформації: цифри, букви, символи ієрогліфічних систем писемності, та системи спеціальних знаків і умовних позначок.

F- метод фіксації інформації: тексти, формульна інформація (у тому числі різні методи представлення хімічних формул і структур), таблична інформація (у тому числі: бланкова, анкетна), графіка (малюнки, креслення, карти, зображення, відеоматеріали та інше), аудіоінформація, аудіовізуальна інформація, цифрова й аналогова інформація, записана різною апаратурою, перфорація (від абетки для сліпих до кодових комбінацій на перфоносіях).

T - технічний засіб, що забезпечує відтворення, реєстрацію, фіксацію, збір, передачу, збереження й обробку документів: засоби ручної обробки, оргтехніка, кінофототехніка, електронно-обчислювальна техніка, засоби і канали зв'язку.

P - правила (способи, методи, алгоритми, програми) перетворення документів при зміні носія інформації;

M - метаінформація про документ (інформація, що описує документ): опис структури документа, опис операцій, дозволених над інформацією, опис інформації, що ідентифікує документ.

Приведений перелік з достатньою повнотою відбиває стан (рівень розвитку) сучасних інформаційних технологій, що спираються на документальні інформаційні ресурси.


Індивідуальне завдання

Використовуючи основні процедури та методи системного аналізу продовжити самостійне дослідження системи, що досліджується (індивідуальне завдання Тема №1) за наступним планом:

1. Запропонувати та самостійно проаналізувати документ, який можна вважати інформаційним ресурсом системи, що досліджується.

2. Описати документ за схемою типового прикладу.

Поради до виконання індивідуального завдання

Основні вимоги до обраного документу: актуальність, значимість, інформативність. В документі повинна розміщуватися інформація про факти, події чи явища досліджуваної системи. Якщо опрацьовується не оригінал документу, а його переклад, треба це зазначити.

В висновку визначить роль відповідного документа в функціонуванні системи.

Теми для обговорення

1. Методи доступу до інформаційних ресурсів в сучасному суспільстві.

2. Тенденції розвитку документальних ресурсів.

3. Поняття "інформація" та "повідомлення" в системі.

Зразок тестових завдань


Поделиться:

Дата добавления: 2014-12-30; просмотров: 180; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты