КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Структура электронной таблицы ⇐ ПредыдущаяСтр 2 из 2 Исходные данные организованы в виде таблицы. Электронная таблица состоит из строк и столбцов. В отличие от обычных электронных таблиц, в которых строки и столбцы равноправны, в STATISTICA они имеют разные смысловые значения. При этом столбцы таблицы называются Variables (переменные), а строки — Cases (случаи, наблюдения). Каждая переменная имеет свое имя, формат и другие атрибуты (которые называются спецификацией переменной), задаваемые пользователем. Переменная представляет собой наблюдаемую величину. Результаты наблюдений записываются в строках таблицы — наблюдениях. Нулевой столбец, в котором по умолчанию указаны номера наблюдений, при необходимости может содержать имена случаев. Ими могут быть либо даты наблюдений, либо какие-то другие имена, обычно естественно возникающие в конкретной задаче, например, имена опрашиваемых, при сборе данных социологического исследования, поэтому в качестве имен случаев STATISTICA позволяет использовать либо число, либо текстовое значение или значение даты. Электронная таблица с исходными данными в STATISTICA называется Spreadsheet. Электронные таблицы с исходными данными хранятся в файлах с расширением *.sta. В дополнение к значениям переменных STATISTICA может хранить в файле с исходными данными и дополнительную информацию как об индивидуальных переменных, так и обо всей таблице в целом. В электронной таблице Spreadsheet пользователь может задать спецификации переменных: • формат отображения (например, число десятичных знаков или формат значений даты или времени); • определенные значения, которые нужно пропускать при расчетах (т.е. коды пропущенных данных); • длинные имена переменных и комментарии; • длинные метки и комментарии цля отдельных значений (см. ранее); • формулы, которые можно использовать для задания, перекодирования или преобразования каждой переменной; • динамические связи между файлом данных STATISTICA и другим Windows-совместимым файлом с использованием механизма DDE. Настройки внешнего вида файла данных (высота и ширина столбцов, цвета и шрифт) также хранятся вместе с данными и могут быть использованы для упрощения идентификации отдельных файлов или наборов данных из разных проектов. Окно спецификаций переменной можно вызывать двойным щелчком на имени переменной в таблице исходных данных. Для удобной работы с переменными, принимающими текстовые значения, реализован так называемый механизм двойной записи. Согласно этому соглашению каждому текстовому значению переменной ставится в соответствие некоторое число. Таким образом,устанавливается соответствие вида число = текстовое значение. Оно может быть установлено автоматически (самой системой при вводе данных) или определено пользователем. При работе с данными всегда можно переключиться с текстовой на числовую форму просмотра исходных данных. Наличие описанного механизма двойной записи позволяет удобно вводить текстовые значения, выполнять необходимые преобразования и, кроме того, любой статистический анализ над текстовыми переменными так, как если бы они принимали числовые значения. Поясним принцип двойной записи на основе данных из таблицы на рис. 1.1. В нем приведены некоторые экономические показатели 10 крупнейших стран мира по численности городского населения: общее число жителей (млн чел.) на 1990,1995,2000 гг.; доля (%) городского населения на 1995 г.; наличие крупных запасов нефти и газа (более 1,5 млрд т); структура ВВП (%) в промышленности, сельском хозяйстве, сфере услуг. Перечисленным показателям в файле данных соответственно присвоены имена: Нас.90, Нас.95, Нас.00, Нас. гор., Нефть, Газ, Пром., С/х, Услуги. Две переменные Нефть и Газ содержат текстовые значения. Щелкните 2 раза левой кнопкой мыши на имени переменной, например, Газ. Предположим, в окне спецификаций переменных, нажав на кнопку Text Labels (текстовые ярлыки) и открыв окно Text Labels Editor (редактор текста ярлыков), сделаны следующие присвоения: 1 = есть, 0 = нет. Тогда для переключения отображения с числовых значений на текстовые и наоборот надо нажать на панели инструментов на кнопку Show/Hide Text Labels. Наличие механизма двойной записи существенно упрощает работу с переменными, принимающими текстовые значения. Например, при вводе данных, вместо того чтобы последовательно вводить текстовые значения, можно сначала ввести числовые значения, а потом приписать им текстовые эквиваленты. Метки значений — это комментарии или описания (до 40 символов), которые можно присвоить определенным текстовым (числовым) значениям наборов данных. Каждое значение переменной может иметь присвоенную ему метку. Их можно отображать и изменять при помощи Text Labels Editor (редактора текста ярлыков), который также доступен через кнопку на панели инструментов или через меню Data. Рассмотрим вновь данные из примера. Мы можем приписать метки для значений есть — запасы газа более 1,5 млрд т и нет — запасы газа не более 1,5 млрд т. В меню Data выберите команду Text Labels Editor. Откроется соответствующее окно (рис. 1.2), из которого можно извлечь необходимую информацию или произвести в нем необходимые отображения и редактирование. Опишем кратко приемы редактирования: • для перемещения между полями можно воспользоваться стрелками перемещения курсора; • для редактирования содержимого какого-либо поля нужно дважды щелкнуть на нем; • для удаления (вставки) новых строк можно использовать мышь: левее поля Text Labels щелкните на уровне соответствующей строки левой кнопкой мыши, далее, переместив на поле Text Labels, щелкните правой кнопкой мыши и произведите необходимые действия — cut (вырезать), paste (вставить). Для того чтобы открыть это окно через панель инструментов, надо вывести на панель инструментов кнопку Text Labels Editor, которая имеет вид, идентичный кнопке Show/Hide Text Labels. Выберите пункт меню View/Toolbars/Customize (вид/панели инструментов/настройка). В открывшемся окне надо выбрать элемент Data (данные) в списке Categories (категории), затем выделить Text Labels Editor в списке Commands (команды) и поместить кнопку на панель инструментов электронной таблицы. Еще более простой способ настроить панель инструментов для пользователя — щелкнуть правой кнопкой мыши на панели инструментов и вывести на нее дополнительные опции. Значения дат в STATISTICA хранятся в юлианском формате, как целые числа, представляющие число дней, прошедших с 1 января 1900 г. Например, дата, отображаемая как 1/21/1968, в юлианском формате представляет число 24858; при этом десятичные знаки интерпретируются как время. Хранящиеся таким образом значения дат можно использовать в любой процедуре анализа. В то же время в отчетах и на графиках можно отображать даты в общепринятом формате (например, для отметок на шкале). Юлианские значения дат в таблице исходных данных можно отображать как в числовом (юлианском) формате, так и в одном из заранее заданных форматов отображения дат. Чтобы изменить формат отображения даты, выберите тип Date (дата) в диалоговом окне текущих спецификаций или из выпадающего меню Format Cells (формат ячеек) и укажите один из предлагаемых в списке форматов отображения (рис. 1.3). При вводе даты в новую переменную сначала необходимо изменить в диалоговом окне текущих спецификаций формат отображения переменной с типа Number (установленного по умолчанию) на тип Date, а затем выбрать нужный формат отображения. Данные можно вводить в любом из заданных форматов. Не обязательно в том формате, который выбран, можно просто вводить двухзначные числа через пробел, программа распознает форматы, преобразует в нужный и сохранит введенные значения. При работе с реальными данными часто приходится иметь дело с ситуациями, когда часть данных не была по каким-либо причинам измерена. В этом случае в соответствующую ячейку электронной таблицы не заносится никакое значение. Ячейка остается пустой. Однако при внутреннем хранении данных STATISTICA приписывает всем пустым ячейкам — пропущенным наблюдениям данных, некоторый специальный код Missing Data Code (код пропущенных данных). Код пропущенных значений устанавливается в спецификации переменной. Значение этого кода по умолчанию равно -9999. Пользователь всегда имеет возможность установить другое значение этого кода для каждой конкретной переменной. Способ, которым пропущенные данные обрабатываются при статистическом анализе, может корректироваться индивидуально для каждого вида анализа. Обычно он может быть установлен из стартовой панели конкретного статистического модуля. Пользователь имеет возможность устранить данные из вычислений, заменить их средним значением или интерполировать их. Возможны и другие способы обработки пропущенных наблюдений. Имеется возможность заменить в исходном файле данных все пропущенные значения переменной на среднее значение. Для этого в меню Data выберите команду Replase Missing Data by Means (замена пропущенных значений на среднее). Создание нового файла с данными в системе STA TISTICA может быть осуществлено при помощи меню File (файл) или из выпадающего меню на панели инструментов. Выберите команду New из меню File. В появившемся диалоговом окне (рис. 1.4) выделите вкладку Spreadsheet (таблица) и укажите Namber of variables (число переменных), и Namber of cases (число случаев). Нажмите ОК. Программа автоматически откроет пустую электронную таблицу Spreadsheet соответствующего размера. Переменные по умолчанию имеют имена Var1, Var2,и заданное число пронумерованных случаев, которые не имеют имен. Для сохранения файла выберите команду Save (сохранить) из меню File. В появившемся диалоговом окне наберите имя файла. Нажмите ОК. В заголовке окна с электронной таблицей автоматически отобразится имя файла с расширением sta и его размер. Если выделить вкладки Report, Macro, Workbook, то можно создать соответственно отчет, рабочую книгу\ макрос. Задать имена случаев можно, дважды щелкнув левой кнопкой мыши на поле имени (где указан номер случая). Для перехода от имени случаев к номерам можно воспользоваться кнопкой Show/Hide Case Names. Согласно стандартным соглашениям об электронных таблицах, для выделения всей таблицы исходных данных нужно щелкнуть на ее левом верхнем углу. Это может оказаться полезным, например, для копирования всего файла в буфер обмена. Для ввода данных в таблицу надо установить указатель мыши на ячейку, в которую необходимо ввести данные. Щелкнуть мышью, для того чтобы сделать эту ячейку активной, и ввести необходимое значение с клавиатуры. Перейти к другой ячейке можно одним из следующих способов: • нажать на клавишу Enter После этого курсор переместится либо вправо, либо вверх, в зависимости от тех установок, которые определены в постоянных параметрах конфигурации системы; • воспользоваться стрелками перемещения курсора; • щелкнуть мышью на любой другой ячейке. Текстовые значения можно непосредственно ввести в таблицу или ввести сначала соответствующие им числовые значения. Для исправления данных в ячейке надо установить указатель мыши в ячейку, в которой необходимо исправить значение, щелкнуть мышью и ввести новое значение. Чтобы не удалять содержимое ячейки при вводе нового значения, нужно дважды щелкнуть на ней до начала ввода. При этом будет включен режим редактирования, а курсор установлен внутри ячейки. Для написания заголовка к именам случаев (например, Страны мира) надо щелкнуть левой клавишей мыши два раза в верхнем левом поле таблицы и ввести соответствующее имя. Аналогичным способом можно записать дополнительную информацию о файле (например, Крупнейшие страны мира по численности городского населения) в верхнем свободном поле таблицы (рис. 1.1).
|