Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Вычисление ошибки коэффициента корреляции.




ТЕМА 7

КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ. ПЛАНИРОВАНИЕ КЛИНИЧЕСКИХ ИССЛЕДОВАНИЙ

 

При изучении общественного здоровья и здравоохранения в научных и практических целях исследователю часто приходится проводить статистический анализ связей между факторными и результативными признаками статистической совокупности (причинно-следственная связь) или определение зависимости параллельных изменений нескольких признаков этой совокупности от какой либо третьей величины (от их общей причины). Необходимо уметь изучать особенности этой связи, определять ее размеры и направление, а также оценивать ее достоверность. С этой целью используется корреляционный и регрессионный анализ.

Этапы проведения анализа связи переменных.

1. Корреляционный анализ. Его цель – определить характер связи (прямая, обратная) и силу связи (связь отсутствует, связь слабая, умеренная, заметная, сильная, весьма сильная, полная связь). Корреляционный анализ дает информацию о характере и степени выраженности связи (по величине коэффициента корреляции), которая используется для отбора существенных факторов, а также для расчета параметров регрессионных уравнений.

2. Расчет параметров и построение регрессионных моделей. Здесь стремятся отыскать наиболее точную меру выявленной связи, для того чтобы можно было прогнозировать, предсказывать значения зависимой величины Y, если будут известны значения независимых величин X1, Х2, .... Хп.

3. Выяснение статистической значимость, т.е. пригодности постулируемой модели для использования ее в целях предсказания значений.

4. Применение статистически значимой модели для прогнозирования (предсказания), управления или объяснения. Если же обнаружена незначимость, то модель отвергают, предполагая, что истинной окажется какая-то другая форма связи, которую надо поискать. Например, с самого начала работы (как бы по умолчанию) строилась и проверялась линейная регрессионная модель. Незначимость ее служит основанием для того, чтобы отвергнуть только линейную форму модели. Возможно, что более подходящей будет нелинейная форма модели.

Корреляционный анализ.Отличительной чертой биологических объектов является многообразие признаков, характеризующих каждый из них. Так, человека можно охарактеризовать возрастом, ростом, весом, различными физиологическими показателями и т. д. Имея однородную совокупность объектов, можно изучить распределение их по любому из их признаков. Весьма часто можно усмотреть известную связь между вариациями по различным признакам. Например, вес образцов, сделанных из одного и тoгo же материала, полностью определяется их объемом. Такую зависимость принято называть функциональной. Для биологических объектов связь обычно бывает менее «жесткой»: объекты с одинаковым значением одного признака имеют, как правило, разные значения по другим признакам. Такую связь между вариациями разных признаков называют корреляцией (дословный перевод: соотношение) между признаками.

Практическое значение установления корреляционной связи – выявление возможной причинно-следственной связи между факторными и результативными признаками (при оценке физического развития, для определения связи между условиями труда, быта и состоянием здоровья, при определении зависимости частоты случаев болезни от возраста, стажа, наличия производственных вредностей и др.), а также – выявление зависимости параллельных изменений нескольких признаков от какой-то третьей величины (например, под воздействием высокой температуры в цехе происходят изменения кровяного давления, вязкости крови, частоты пульса и др).

Стандартный способ выявления взаимосвязи нескольких переменных, измеряемых в порядковой или интервальной шкалах, – подсчет коэффициента корреляции. Коэффициент корреляции одним числом измеряет силу связи между изучаемыми явлениями и дает представление о ее направленности. По направлению связь может быть прямой или обратной. По силе связи коэффициенты корреляции колеблются от 1 (полная связь) до 0 (отсутствие связи). Коэффициент корреляции может иметь значение от –1 до +1, т.е. иметь отрицательное либо положительное значение. В этих случаях говорят об обратной или прямой корреляционной взаимосвязи. Величина коэффициента характеризует силу корреляционной взаимосвязи.

Чем ближе модуль коэффициента корреляции к единице, тем сильнее или глубже корреляционная взаимосвязь между двумя вариационными рядами. Модульное значение выше 0,8 характеризуют сильную взаимосвязь, в интервале 0,8-0,5 – выраженную взаимосвязь, 0,5-0,2 – слабую взаимосвязь, менее 0,2 (0,2 – 0) – отсутствие взаимосвязи(рис. 7.1).

Рис. 7.1. Схема оценки силы корреляционной связи по величине коэффициента корреляции.

 

Коэффициент корреляции для нормально распределенных наблюдений (коэффициент корреляции Пирсона) рассчитывается по формуле (7.1):

, (7.1)

где и – варианты сопоставляемых вариационных рядов, и отклонение каждой варианты от своей средней арифметической ( и ).

В случае работы с данными, распределение которых отлично от нормального, необходимо пользоваться ранговыми методами – вычислять коэффициент корреляции Кендалла (для порядковых переменных) или, лучше, коэффициент корреляции Спирмена (непараметрический аналог коэффициента Пирсона для интервальных и порядковых переменных). Коэффициент Пирсона равен единице (или минус единице) тогда и только тогда, когда две переменные (х и у) связаны линейной зависимостью ( ). Коэффициент Спирмена (или Кендалла) равен 1, если две переменные связаны правилом: большему значению переменной х всегда соответствует большее значение переменной у. Чем ниже коэффициент корреляции, тем сильнее отклонение от этих правил.

Коэффициент ранговой корреляции Кендалла

Применяется для выявления взаимосвязи между количественными или качественными показателями, если их можно ранжировать. Значения показателя X выставляют в порядке возрастания и присваивают им ранги. Ранжируют значения показателя Y и рассчитывают коэффициент корреляции Кендалла (7.2):

(7.2)

где , P – суммарное число наблюдений, следующих за текущими наблюдениями с большим значением рангов Y,

Q – суммарное число наблюдений, следующих за текущими наблюдениями с меньшим значением рангов Y (равные ранги не учитываются).

Коэффициент ранговой корреляции Спирмена

Каждому показателю X и Y присваивается ранг. На основе полученных рангов рассчитываются их разности d и вычисляется коэффициент корреляции Спирмена (7.3):

(7.3)

 

Положительная корреляционная взаимосвязь между двумя вариационными рядами и свидетельствует о том, что величина прямо зависит от величины , отрицательная говорит об обратной зависимости.

Важно отметить, что установление корреляции между признаками само по себе еще не дает оснований делать какие-либо заключения о причинно-следственных связях между ними. В случае несгруппированной совокупности может быть получено наглядное представление о наличии или отсутствии корреляции путем построения так называемого корреляционного поля (рис. 7.2). Вытянутость корреляционного поля в диагональном направлении свидетельствует о наличии корреляции между обоими признаками. Если число вариант вели­ко, то корреляционное поле часто имеет вид более или менее правильного эллипса со сгущением точек в центре и сравнительно редким их расположением на периферии; отклонение осей эллипса от координатных направлений указывает на наличие корреляции.

Рис. 7.2. Корреляционное поле.

 

Вычисление ошибки коэффициента корреляции.

1. Ошибка коэффициента корреляции, вычисленного методом квадратов (Пирсона) (7.4):

, (7.4)

где – коэффициент корреляции, n – объем выборки.

 

2. Ошибка коэффициента корреляции, вычисленного ранговым методом (Спирмена) (7.5) :

, (7.5)

где – коэффициент корреляции, n – объем выборки.


Поделиться:

Дата добавления: 2015-08-05; просмотров: 471; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты