КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Сравнение средних значений нескольких выборок ⇐ ПредыдущаяСтр 4 из 4 (множественные сравнения) Если план исследования включает сравнение большего числа групп (больше, чем две группы), совершенно недопустимо просто сравнивать их попарно. Для корректного решения этой задачи можно воспользоваться, например, дисперсионным анализом. Однако дисперсионный анализ позволяет проверить лишь гипотезу о равенстве всех сравниваемых средних. Но, если гипотеза не подтверждается, нельзя узнать, какая именно группа отличалась от других. Это позволяет сделать методы множественного сравнения, которые в свою очередь также бывают параметрические и непараметрические. Эти методы дают возможность провести множественные сравнения так, чтобы вероятность хотя бы одного неверного заключения оставалась на первоначальном выбранном уровне значимости, например, 5%. Параметрические критерии. Критерий Стьюдентадля множественных сравнений основан на использовании неравенства Бонферрони: если k-раз применить критерий с уровнем значимости a, то вероятность хотя бы в одном случае найти различие там, где его нет, не превышает произведения k на a. Этот метод работает, если число сравнений невелико, обычно не больше 8. При большем числе сравнений критерий Ньюмана-Кейлса и Тьюки дают более точную оценку вероятности a. Критерий Даннета более чувствительный, чем предыдущий, особенно при большом числе групп. Критерий Даннета является модификацией критерия Ньюмана-Кейлса. Для проверки критерия средние значения упорядочиваются по абсолютной величине их отличия от контрольной группы, сравнения начинают с группы, наиболее отличающейся от контроля. Если различия с очередной группой не найдены, сравнения прекращаются. Непараметрические критерии
Критерий Краскела-Уоллиса – непараметрический критерий для сравнения средних значений нескольких независимых выборок – основан на построении объединенного вариационного ряда из вариант рассматриваемых выборок и присвоении рангов всем вариантам в объединенном ряду, предназначен для проверки равенства медиан нескольких выборок. Критерий Фридмана – это непараметрический аналог дисперсионного анализа повторных измерений, применяется для анализа повторных измерений, связанных с одним и тем же индивидуумом. Логика критерия очень проста. Каждый больной ровно один раз подвергается каждому методу лечения (или наблюдается в фиксированные моменты времени). Результаты наблюдения у каждого больного упорядочиваются. Причем мы отдельно упорядочиваем значения у каждого больного независимо от всех остальных. Таким образом, получается столько упорядоченных рядов, сколько больных участвует в исследовании. Далее, для каждого метода лечения вычисляется сумма рангов. Если разброс сумм велик - различия статистически значимы. Порядок проведения множественных сравнений средних значений представлен на рис. 6.2. ANOVA (дисперсионный анализ) Дисперсионный анализ был разработан английским математиком Р.Фишером. Его чаще используют в научно-практических исследованиях общественного здоровья и здравоохранения для изучения влияния одного или нескольких факторов на результативный признак. Дисперсионный анализ основан на принципе «отражения разнообразий значений факторного на разнообразии значений результативного признака» и устанавливает силу влияния фактора в выборочных совокупностях. Сущность метода дисперсионного анализа заключается в измерении отдельных дисперсий (общая, факториальная, остаточная), и дальнейшем определении силы (доли) влияния изучаемых факторов (оценки роли каждого из факторов, либо их совместного влияния) на результативный признак. Дисперсионный анализ – это статистический метод оценки связи между факторными и результативным признаками в различных группах, отобранный случайным образом, основанный на определении различий (разнообразия) значений признаков. В основе дисперсионного анализа лежит анализ отклонений всех единиц исследуемой совокупности от среднего арифметического. В качестве меры отклонений берется дисперсия ( ) – средний квадрат отклонений. Отклонения, вызываемые воздействием факторного признака (фактора) сравниваются с величиной отклонений, вызываемых случайными обстоятельствами. Если отклонения, вызываемые факторным признаком, более существенны, чем случайные отклонения, то считается, что фактор оказывает существенное влияние на результативный признак. Условия применения дисперсионного анализа: 1. Задачей исследования является определение силы влияния одного (до 3) факторов на результат или определение силы совместного влияния различных факторов (пол и возраст, физическая активность и питание и т.д.). 2. Изучаемые факторы должны быть независимые (несвязанные) между собой. Например, нельзя изучать совместное влияние стажа работы и возраста, роста и веса детей и т.д. на заболеваемость населения. 3. Подбор групп для исследования проводится рандомизированно (случайный отбор). Организация дисперсионного комплекса с выполнением принципа случайности отбора вариантов называется рандомизацией (от англ. random), т.е. выбранные наугад. 4. Можно применять как количественные, так и качественные (атрибутивные) признаки. Оценка значимости различия при альтернативной форме учета реакций.Для оценки значимости расхождения частот какого-либо явления в двух группах может быть использован статистический метод, который носит название критерия c2. Этот критерий может быть применен, например, при сравнении групп, получивших различные сравниваемые по своей активности препараты; групп, получивших различные дозы изучаемого препарата или одну и ту же дозу различными путями введения и т.д. Для описания результатов такого исследования удобно применять таблицу сопряженности, в которой для каждой из групп указывается число пациентов с каждым из градаций признака. Таким образом, для 2-х рассматриваемых групп и 2-х возможных исходов получается таблица размерности 2х2 (рис. 6.1). Для ответа на вопрос о значимости различий между группами вычисляется величина статистики c2, которая является показателем максимально возможных при данном уровне значимости отклонений частот. Критерий c2 может применяться и к таблице сопряженности произвольной размерности. Точный критерий Фишера основан на переборе всех возможных вариантах заполнения таблицы сопряженности при данной численности групп. Позволяет получить точные значения вероятности событий, столь же или еще менее вероятных, чем те, которые наблюдались в действительности. Критерий Мак-Нимара применяется для анализа связанных измерений в случае измерения реакции для связанной переменной. Является аналогом параметрического критерия Стьюдента для зависимых выборок или непараметрического Т-критерий Уилкоксона. Критерий Кокрена является аналогом непараметрического критерия Фридмана для случая альтернативного учета реакций. Сравнивается влияние различных воздействий на одну группу (мультиперекрестный план – повторные измерения) или однородные группы (рандомизированный блочный план). Нулевая гипотеза состоит в том, что в генеральной совокупности доли всех изучаемых воздействий одинаковы. Полученное значение статистики Q проверяется по таблицам c2 для выбранного уровня значимости и числа степеней свободы. Порядок проведения парных и множественных сравнений качественных признаков представлен на рис. 6.1, 6.2.
Рис 6.1. Схема проведения парного сравнения средних значений.
Рис. 6.2. Схема проведения множественного сравнения.
Контрольные вопросы
Список литературы
|