Как т критерий стьюдента сделать в spss

Добавил пользователь Дмитрий К.
Обновлено: 07.09.2024

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гржибовский А.М., Иванов С.В., Горбатова М.А.

В настоящей работе представлены общие сведения об использовании параметрического непарного критерия Стьюдента и непараметрического критерия Манна-Уитни для сравнения количественных признаков в независимых выборках. Описан алгоритм расчета критериев с использованием программного обеспечения Statistica 10 и SPSS 20, а также представлена интерпретация результатов расчетов. Настоящая статья призвана дать общие сведения об использовании критериев Стьюдента и Манна-Уитни, и не заменяет прочтения специализированной литературы по статистике и клинической эпидемиологии.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гржибовский А.М., Иванов С.В., Горбатова М.А.

Сравнение количественных данных двух парных выборок с использованием программного обеспечения Statistica и SPSS: параметрические и непараметрические критерии

Сравнение количественных данных трех и более независимых выборок с использованием программного обеспечения Statistica и SPSS: параметрические и непараметрические критерии

Сравнение двух несвязанных выборок c использованием пакета статистических программ Stata: непараметрические критерии

Сравнение количественных данных трех и более парных выборок с использованием программного обеспечения Statistica и SPSS: параметрические и непараметрические критерии

This is the second paper of the series of articles where we present basic principles of statistical data analysis using Statistica and SPSS software for beginners. Step-be-step algorithms for Student’s unpaired t-test and Mann-Whitney test for independent samples are presented. The main aim of this paper is to provide basic knowledge on ho to compare continuous variables in two independent samples with practical examples using commonly used software. The article complements, but does not substitute specialized literature on biostatistics and clinical epidemiology.

Получена: 3 марта 2015 / Принята: 15 марта 2016 / Опубликована online: 6 мая 2016 УДК 614.2 + 303.4

СРАВНЕНИЕ КОЛИЧЕСТВЕННЫХ ДАННЫХ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК С ИСПОЛЬЗОВАНИЕМ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ STATISTICA И SPSS: ПАРАМЕТРИЧЕСКИЕ И НЕПАРАМЕТРИЧЕСКИЕ

1 Национальный Институт Общественного Здравоохранения, г. Осло, Норвегия;

2 Северный Государственный Медицинский Университет, г. Архангельск, Россия;

3 Международный Казахско-Турецкий Университет им. Х.А. Ясави, г. Туркестан, Казахстан;

4 Северо-Восточный Федеральный Университет, г. Якутск, Россия;

5 Северо-Западный Государственный Медицинский Университет им. И.И. Мечникова, г. Санкт-Петербург, Россия.

Ключевые слова: Statistica, SPSS, критерии Стьюдента, критерий Манна-Уитни, независимые группы.

1Norwegian Institute of Public Health, Oslo, Norway;

2Northern State Medical University, Arkhangelsk, Russia;

3North-Eastern Federal University, Yakutsk, Russia;

international Kazakh-Turkish University, Turkestan, Kazakhstan;

5North-Western State Medical University n.a. I.I. Mechnikov, St. Petersburg, Russia.

paper is to provide basic knowledge on ho to compare continuous variables in two independent samples with practical examples using commonly used software. The article complements, but does not substitute specialized literature on biostatistics and clinical epidemiology.

Keywords: Statistica, SPSS, t-test, Mann-Whitney test, independent samples.

STATISTICA И SPSS БАГДАРЛАМАЛЫК КДМТАМАСЫЗ ЕТУД1 КОЛДАНУМЕН ЕК1 ТЭУЕЛС1З 1Р1КТЕМЕЛЕРД1Н САНДЫК МЭЛ1МЕТТЕР1Н САЛЫСТЫРУ: ПАРАМЕТРЛ1К ЖЭНЕ ПАРАМЕТРЛ1К ЕМЕС КРИТЕРИЛЕР

1 Когамдьщ Денсаулык сактау ?лттык Институты, Осло к., Норвегия;

2 СолтYCтiк Мемлекетлк Медициналык Университетi, Архангельск к., Ресей;

3 Х.А. Ясави ат. Халыкаралык Казак - ТYрiк Университетi, Туркестан, Казакстан;

4 СолтYCтiк - Шыгыс Федералдык Университетi, Якутск к-, Ресей;

5 И. И. Мечников атынд. Солтуслк - Батыс мемлекеттiк медициналык университетi, Санкт-Петербург к., Ресей.

Осы жумыста тэуелсiз iрiктемелердH сандык белгтерш салыстыру Yшiн Стьюдент nараметрлiк косарлы емес критерилерiн жэне Манна-Уитни параметрлт емес критерилерiн колдану туралы жалпы мэлiметтер берiлген. Statistica 10 жэне SPSS 20 багдарламалык камтамасыз ету^ пайдаланумен критерилер мэлiметтерi есебшН алгоритмi суреттелген жэне есептер нэтижелершН интерпретациясы берiлген. Осы макала Стьюдент жэне Манна-Уитни критерилерш колдану туралы жалпы мэлiметтер беруге талап етiлген жэне статистика жэне клиникалык эпидемиология бойынша мамандандырылган эдебиеттi окудыц орнын баспайды.

Heri3ri сездер: Statistica, SPSS, Стьюдент критерилерш Манна-Уитни критериi, тэуелсiз топтар.

Гржибовский А. М., Иванов С. В., Горбатова М. А. Сравнение количественных данных двух независимых выборок с использованием программного обеспечения Statistica и SPSS: параметрические и непараметрические критерии / / Наука и Здравоохранение. 2016. №2. С. 5-28.

Гржибовский А. М., Иванов С. В., Горбатова М. А. Statistica и SPSS багдарламалы; камтамасыз етуд1 колданумен ек1 тэуелаз ?рктемелердщ сандык мэл1меттер1н салыстыру: параметрлк жэне параметрлк емес критерилер / / Гылым жэне Денсаулык сактау. 2016. №2. Б. 5-28.

Настоящая статья продолжает серию публикаций [11], посвященных статистическому анализу данных биомедицинских исследований. Цель данной серии статей -формирование у начинающего исследователя

базисных представлений о статистическом анализе данных, приобретение читателем практического опыта использования современного статистического программного обеспечения и предупреждение типичных

ошибок, возникающих в процессе статистической обработки данных.

Вопросы корректной статистической обработки данных исследований в здравоохранении актуальны не только в Казахстане, но и в странах СНГ, Европы и США, и высокое качество статистического анализа является обязательным условием востребованности научных результатов и транспарентности научных достижений отдельных исследователей и

исследовательских коллективов в международном научном сообществе [20, 1].

Настоящая статья посвящена вопросу сравнения количественных данных двух независимых групп с использованием программного обеспечения Statistica 10 и SPSS 20.

Ключевую роль в проверке исследовательской гипотезы играет статистический анализ данных. На этапе статистической обработки также формулируются 2 гипотезы - нулевая (Hq) и

альтернативная (Н1) [4, 24, 28]. Нулевая статистическая гипотеза предполагает, что различия между сравниваемыми группами отсутствуют. Альтернативная статистическая гипотеза, напротив, предполагает, что сравниваемые группы различаются.

Для принятия решения об отклонении нулевой гипотезы ориентируются на уровень статистической значимости (р).

Общепринятым в биомедицинских исследованиях критическим уровнем значимости является значение 0,05. Если р 0,05, то принимается нулевая гипотеза, которая говорит о том, что сравниваемые группы не отличаются друг от друга. В ряде случаев за критический уровень значимости принимают значение 0,01 или 0,001, которые допускают вероятность зафиксировать различия там, где их нет, не превышающую 1% и 0,1% соответственно.

Для проверки статистических гипотез используются параметрические и непараметрические критерии.

Параметрическим критерием для сравнения двух независимых групп является

Для того, чтобы использовать непарный критерий Стьюдента, необходимо соблюдение следующих условий [6, 26]:

1. Количественный тип данных (желательно, чтобы данные были непрерывными, а не дискретными).

2. Наличие не более чем двух выборок.

4. Нормальное распределение изучаемого признака в популяции, из которой взяты выборки (как правило, сведения о распределении признака в популяции отсутствуют, и поэтому распределение оценивают в каждой из сравниваемых групп по-отдельности).

5. Равенство дисперсий изучаемого признака в популяциях, из которых взяты

выборки (дисперсии также оцениваются в каждой из сравниваемых групп по-отдельности). Современное программное обеспечение позволяет рассчитывать значение критерия Стьюдента и уровень статистической значимости, даже если дисперсии не равны.

Рассчитывается критерий Стьюдента по формуле:

где М1 и М2 - средние арифметические значения количественного признака группы 1 и группы 2;

Э1 и Э2 - стандартные отклонения признака для группы 1 и группы 2;

П1 и П2 - количество наблюдений в группе 1 и в группе 2 соответственно.

Расчет среднего арифметического значения для каждой из выборок производится по формуле:

Xi + X2 + X3 + . + X,

где Х1 . X - значения количественного признака в группе, для которой рассчитывается стандартное отклонение, п -количество наблюдений в данной группе.

Расчет значения стандартного отклонения для каждой из групп производится по формуле:

(Xi - М)2 + (X2 - М)2 + (X3 - М)2 + . + (X - М)2

После расчета значения критерия Стьюдента также потребуется рассчитать количество степеней свободы:

?г = (П1 - 1) + (П2 - 1)

Далее используется таблица 1-распределения, в которой, с учетом количества степеней свободы, сравниваются эмпирическое и критическое значение 1: если эмпирическое значение превышает критическое для заданного уровня значимости (0,05, 0,01 или 0,001), то нулевая гипотеза

отклоняется и принимается альтернативная гипотеза, согласно которой сравниваемые группы различаются. Таблицы значений 1 для различных уровней статистической значимости приведены во многих руководствах по статистике, например, в [23, 4, 17].

Для наглядного представления о ручном методе расчета критерия Стьюдента приведем гипотетический пример.

Допустим, сравниваются две схемы лечения (базисная и новая), и конечной точкой, по которой судят об эффективности

одной или другой схемы терапии, является а группа 2 (п = 24) - новую схему терапии. срок госпитализации. Пациенты были Сведения о сроках госпитализации пациентов рандомизированы на две группы, из которых обеих групп представлены в таблице 1. группа 1 (п = 23) получала базисную терапию,

Сроки госпитализации пациентов, получавших базисную и новую схему терапии.

Группа 1 (базисная терапия) Группа 2 (новая схема терапии)

№ пациента Срок лечения, дней № пациента Срок лечения, дней № пациента Срок лечения, дней № пациента Срок лечения, дней

1 8 13 10 1 4 13 7

2 6 14 8 2 6 14 7

3 5 15 7 3 3 15 7

4 6 16 8 4 5 16 8

5 7 17 9 5 5 17 7

6 6 18 9 6 5 18 9

7 7 19 11 7 6 19 9

8 7 20 9 8 6 20 8

9 10 21 9 9 5 21 8

10 5 22 9 10 6 22 8

11 8 23 11 11 7 23 10

12 10 - - 12 7 24 9

На основании имеющихся данных по вышеприведенным формулам рассчитываем среднее арифметическое значение для каждой из групп: М1 = 8,04 дня, М2 = 6,75 дня (разница средних значений составляет 1,29 дня).

Далее рассчитываем значение стандартного отклонения для каждой из групп: Э1 = 1,77 дня, Э2 = 1,72 дня.

Подставляем полученные значения в формулу расчета критерия Стьюдента:

1 ^(1,772/23 + 1,722/24) 2,53

Количество степеней свободы: df = (23 - 1) + (24 - 1) = 45.

Согласно табличным данным [23, 4, 17], для критического уровня статистической значимости, равного 0,05, и количества степеней свободы, равного 45, критическое

значение 1 составляет 2,014, ниже значения 1, полученного в результате расчетов, поэтому нулевая гипотеза отвергается и принимается альтернативная гипотеза: длительность госпитализации пациентов группы 2, получающих новую схему терапии в среднем на 1,29 дня меньше, чем у пациентов группы 1, получающих базисную терапию (1 = 2,53, df = 45, р 0,05).

Таким образом, возвращаясь к особенностям использования

параметрических и непараметрических критериев, можно выделить три этапа

проведения сравнения двух независимых групп:

1. Убеждаемся в том, что анализируемые данные являются количественными, а группы - независимыми.

2. Оцениваем распределение переменной в обеих группах: если оно близко к нормальному распределению, то следует использовать параметрические методы, если нет - методы непараметрической статистики.

3. Используем параметрический критерий, если в обеих группах близко к нормальному, или непараметрический критерий, если распределение переменной отличается от нормального.

Возможна ситуация, когда распределение данных похоже на нормальное, но скошено (пик колоколообразного распределения смещен влево относительно центра гистограммы при правосторонней асимметрии или вправо при левосторонней асимметрии). В таком случае возможно проведение трансформации данных таким образом, чтобы распределение стало похожим на нормальное, чтобы обеспечить возможность использования методов параметрической статистики, обладающих большей мощностью по сравнению с непараметрическими методами. При правосторонней асимметрии извлекают квадратный корень из значений признака, проводят логарифмическое преобразование с использованием натурального или десятичного логарифма, или осуществляют гармоническое преобразование по формуле

Для приобретения читателем практических навыков проведения статистического сравнения двух независимых выборок количественных переменных, в качестве практического примера будет рассмотрен фрагмент данных, которые были собраны в процессе крупного исследования, направленного на изучение метаболического синдрома и его детерминант в условиях неблагополучной социально-экологической ситуации в Южном Казахстане [15, 18, 14, 22]. В ходе данного исследования получены значения индекса массы тела (ИМТ) и уровня холестерина крови (непрерывные количественные признаки) 68 мужчин и 230 женщин (всего 298 пациентов).

Следует отметить, что представленные ниже алгоритмы действий являются только инструментом анализа данных, так как корректная интерпретация полученных результатов требует наличия базисных знаний в области биомедицинской статистики, которые могут быть получены только путем изучения специализированной литературы [4, 30, 18, 17, 28].

Сравнение 2-х независимых групп с использованием программы Statistica 10.

Задача статистического анализа данных -выяснить, различаются ли включенные в исследование мужчины и женщины по значению ИМТ и уровню холестерина. Таким образом, сравниваемыми переменными являются ИМТ и уровень холестерина, а пол является группирующей дихотомической переменной.

На первом этапе обработки данных следует выбрать метод статистического анализа, и для этого необходимо определить тип распределения (алгоритм проверки типа распределения подробно описан в предыдущей статье настоящей серии [11]).

Краткое описание действий:

2. Выбор вариационных рядов для анализа.

4. Настройка параметров вывода показателей описательной статистики.

5. Настройка вывода вышеперечисленных статистических критериев, графиков и показателей описательной статистики для группы мужчин и женщин по-отдельности.

6. Запуск анализа данных.

Л1 STATISTICA - [Workbook!* - Summary: BMI]

^H File Edit View ?nsert Format Statistics

S Normal Graph J Workbookl*

ВBasic Statistics/Tables (BMI_chol_STAT) рЬ-н I? Descriptive statistics dialog Gender=2

?p Summary: Cholesterol E)-0 Gender=l

???3 Summary: BMI ??p Summary: Cholesterol

Рис. 1. Дерево каталогов программы Statistica 10.

В результате программа представила четыре окна вывода результатов анализа, которые представлены на рисунках 2, 3, 4 и 5.

- На квантильной диаграмме точки группируются по прямой (в группе мужчин и группе женщин по-отдельности).

- Среднее арифметическое значение и медиана имеют близкие значения (в группе мужчин и группе женщин по-отдельности).

- Статистическая значимость критерия Колмогорова-Смирнова превышает значение 0,05 (в группе мужчин и группе женщин по-отдельности).

- Статистическая значимость критерия Шапиро-Уилка превышает значение 0,05 (в группе мужчин).

- Значения асимметрии не превышает 1,0 (в группе мужчин и группе женщин по-отдельности).

- Значение эксцесса не превышает 1,0 (в группе женщин).

В пользу отличия имеющегося распределения от нормального свидетельствуют статистическая значимость

Таким образом, на первом этапе обработки данных установлено, что для сравнения группы мужчин с группой женщин по значению ИМТ необходимо использовать параметрические критерии, а для сравнения группы мужчин с группой женщин по уровню холестерина крови - непараметрические критерии.

Задачей второго этапа исследования является ответ на вопрос - отличается ли ИМТ мужчин от ИМТ женщин и отличается ли уровень холестерина крови у мужчин от уровня холестерина крови у женщин.

Добрый день всем! у меня возникла проблема, со статистикой пришлось работать совсем недавно, необходимо высчитывать значения критерия стьюдента и уровня значимости (р) для выборок. до меня этим занимался один сотрудник и делал это в программе spss и как он это делал неизвестно, я ей не владею, однако пользуюсь программой statistica русифицированной. у меня в ходе работы возник ряд вопросов:
1) у нас есть данные, например, по количеству летальных и выживших пациентов за какой-то промежуток времени, и нужно сравнить эти данные, допустим выживших было 300 человек из 350 прооперированных за 2010 год, а за 2011 год выжило 270 из 310 прооперированных. стало быть мне нужно посчитать сколько процентов выжило в 2010 и сколько выжило в 2011 году и проверить на достоверность различий этих двух групп пациентов. в программе statistica я строила два столбца (1-состоял из 300 единиц и 50 нулей, что в сумме давало мне как раз 350 прооперированных за 2010 год и точно так же строила для второй группы 2011 года, но уже соответственно из 270 единиц и 40 нулей), это как вы понимаете были переменные, далее я заходила в раздел основных статистик и считала среднее и ошибку среднего, средним получались проценты. Далее заходила в раздел t-теста и проводила его для независимых переменных, хочу подчеркнуть, что именно переменных, мне выводилось значение t и р. Вопрос: верны ли вообще мои действия?
2) в программе "статистика" мне удалось провернуть вышеописанную штуку, но в англоязычной версии не было кнопки "t-тест для независимых переменных", а лишь зависимых и независимых выборок, где мне пришлось бы выбирать какую-то группирующую и т.д. (для этого как я поняла вообще нужно вбивать всех 600 с лишним пациентов и указывать каждому год и статус летальности или живости) Но моей целью не стоит забить в выборки каждого пациента каждого года, моя задача лишь по имеющимся данным (знаем количество выживших и летальных в каждом году) выявить наличие или отсутствие различий по количеству в двух уже сформированных по годам группах. До меня , как я уже говорила ранее, кто-то считал все это дело в программе spss, в которой я кстати тоже не нашла как посчитать t и р таким способом, как это делала я. Вопрос: как он это сделал в spss?Потому что делал он это как-то очень быстро и просто. может вообще при помощи таблицы сопряженности как-то

Сорри за многословность, буду очень признательна за помощь бестолочи

ogurtsov

Гениальная догадка, и я молодец, что начал читать с конца.

сонька

passant

Для выявления корреляции выборок, измеряемых в дихотомических шкалах ( а у Вас именно такая шкала "выжил"-"умер" или "1"-"0") используются Коэффициент Ассоциации Юла, коэффициент контингенции(сопряженности) Бравайса, Коэффициент Жаккара и пр.
И да, делается это с помощью таблицы сопряженности.

100$

Сорри за многословность, буду очень признательна за помощь бестолочи

Дорогая Сонька!
По результатам выборочного обследования в 99,999999999999 . % случаев проверяют гипотезу о средней и гипотезу о доле.
Применительно к вашему случаю это означает, что в выборке 2010 г. доля w1=300/350=.857143 доля интересующих вас пациентов, в 2011 г. w2=270/310=,870968
Существует разность выборочных долей w1-w2=|.857143 - .870968|=.013825 и стандартная ошибка выборочной разности долей Mu(w1-w2)=SQR(p*(1-p)*(1/n1+1/n2)),
где р - доля признака в генеральной совокупности, n1 и n2 - объемы каждой из двух выборок.
Эта формула справедлива, если р в двух сравниваемых ген. совокупностях одинакова. Т.к. она обычно неизвестна, то пользуются ее оценкой по результатам выборочных исследований р=(m1+m2)/(n1+n2), где m1 и m2 - соответствующие частоты (300 и 270)
Тогда р=(300+270)/(350+310)=.863636

T-критерий =|w1-w2|/Mu(w1-w2)=.013825/SQR(.863636*(1-.863636)*(1/350+1/310))=.013825/.026765=.516523.
Поскольку критическое значение t-статистики равно 1,963576, то на 5%-ном уровне значимости нулевая гипотеза не отвергается. Выборки статистически неразличимы.

Эти вычисления занимают 30 сек. на калькуляторе. Не надо насиловать СПСС и себя.

сонька

Эти вычисления занимают 30 сек. на калькуляторе. Не надо насиловать СПСС и себя.

100$

Не имею ни малейшего представления

drevgen

В SPSS не знаю. А в Statistic'e идете на вкладку базовые статистики/ таблицы, выбираете строчку тесты различия (предпоследняя она), там будет написано еще r, %, means, нажимаете, получите вкладочку с 3-мя окошками, выбираете самое нижнее - разница пропорций, вводите, соответственно, частоту и общее количество 1 группы, затем - 2 группы, выбираете p односторонний или двусторонний, жмете рассчитать, получите результат сравнения пропорций. В Екселе, эти формулы, что вам дали, забиваются вручную в таблице 2х2

сонька

DrgLena

drevgen

Ну не владею я русским литературным, не могу оценить тонко оценить разницу между различием и разницей. На английском - difference between two proportions

DrgLena

drevgen

В хелпе статистике так:
Difference between two proportions. These options are used to compute the significance level for the difference between two proportions.

Pr. 1. Enter the proportion of the first sample.

Pr. 2. Enter the proportion of the second sample.

N1. Enter the sample size (number of samples) of the first sample.

N2. Enter the sample size of the second sample.

Compute. After you have entered the values, click the Compute button to calculate the p-value. Both One-sided and Two-sided tests can be performed. The p-level is computed based on the t-value for the respective comparison:

The degrees of freedom are computed as

leo_biostat

Сорри за многословность, буду очень признательна за помощь бестолочи

Соня, привет!
Вы пишите: ". необходимо высчитывать значения критерия стьюдента". Использование t-критерия Стьюдента, в действительности это весьма вероятная ошибка. Поскольку этак акция допустима реально лишь в нескольких процентах случаев. Из-за того, что корректное использование этого критерия требует ОБЯЗАТЕЛЬНОГО ВЫПОЛНЕНИЯ двух других условий. Что на реальных данных выполняется крайне редко. В двух словах эти детали не описать. Почитайте пару статей, где эти аспекты описаны подробно. Это статьи по адресам

Проверка статистической гипотезы позволяет сделать строгий вывод о характеристиках генеральной совокупности на основе выборочных данных. Гипотезы бывают разные. Одна из них – это гипотеза о средней (математическом ожидании). Суть ее в том, чтобы на основе только имеющейся выборки сделать корректное заключение о том, где может или не может находится генеральная средняя (точную правду мы никогда не узнаем, но можем сузить круг поиска).

Распределение Стьюдента

Общий подход в проверке гипотез описан здесь, поэтому сразу к делу. Предположим для начала, что выборка извлечена из нормальной совокупности случайных величин X с генеральной средней m и дисперсией s 2 . Средняя арифметическая из этой выборки, очевидно, сама является случайной величиной. Если извлечь много таких выборок и посчитать по ним средние, то они также будут иметь нормальное распределение с математическим ожиданием m и дисперсией

Тогда случайная величина

имеет стандартное нормальное распределение со всеми вытекающими отсюда последствиями. Например, с вероятностью 95% ее значение не выйдет за пределы ±1,96.

Однако такой подход будет корректным, если известна генеральная дисперсия. В реальности, как правило, она не известна. Вместо нее берут оценку – несмещенную выборочную дисперсию:

Возникает вопрос: будет ли генеральная средняя c вероятностью 95% находиться в пределах ±1,96s_x?. Другими словами, являются ли распределения случайных величин

Впервые этот вопрос был поставлен (и решен) одним химиком, который трудился на пивной фабрике Гиннесса в г. Дублин (Ирландия). Химика звали Уильям Сили Госсет и он брал пробы пива для проведения химического анализа. В какой-то момент, видимо, Уильяма стали терзать смутные сомнения на счет распределения средних. Оно получалось немного более размазанным, чем должно быть у нормального распределения.

Посмотрим, что же мог увидеть У. Госсет. Сгенерируем 20 тысяч нормальных выборок из 6-ти наблюдений со средней (X?) 50 и среднеквадратичным отклонением (s) 10. Затем нормируем выборочные средние, используя генеральную дисперсию:

Получившиеся 20 тысяч средних сгруппируем в интервалы длинной 0,1 и подсчитаем частоты. Изобразим на диаграмме фактическое (Norm) и теоретическое (ENorm) распределение частот выборочных средних.

Точки (наблюдаемые частоты) практически совпадают с линией (теоретическими частотами). Оно и понятно, ведь данные взяты из одной и то же генеральной совокупности, а отличия – это лишь ошибки выборки.

Проведем новый эксперимент. Нормируем средние, используя выборочную дисперсию.

Снова подсчитаем частоты и нанесем их на диаграмму в виде точек, оставив для сравнения линию стандартного нормального распределения. Обозначим эмпирическое частоты средних, скажем, через букву t.

У Госсета-Стьюдента не было последней версии MS Excel, но именно этот эффект он и заметил. Почему так получается? Объяснение заключается в том, что случайная величина

зависит не только от ошибки выборки (числителя), но и от стандартной ошибки средней (знаменателя), которая также является случайной величиной.

Давайте немного разберемся, какое распределение должно быть у такой случайной величины. Вначале придется кое-что вспомнить (или узнать) из математической статистики. Есть такая теорема Фишера, которая гласит, что в выборке из нормального распределения:

1. средняя X? и выборочная дисперсия s 2 являются независимыми величинами;

2. соотношение выборочной и генеральной дисперсии, умноженное на количество степеней свободы, имеет распределение ch 2 (хи-квадрат) с таким же количеством степеней свободы, т.е.

где k – количество степеней свободы (на английском degrees of freedom (d.f.))

Вернемся к распределению средней. Разделим числитель и знаменатель выражения

Числитель – это стандартная нормальная случайная величина (обозначим x (кси)). Знаменатель выразим из теоремы Фишера.

Тогда исходное выражение примет вид

Это и есть t-критерий Стьюдента в общем виде (стьюдентово отношение). Вывести функцию его распределения можно уже непосредственно, т.к. распределения обеих случайных величин в данном выражении известны. Оставим это удовольствие математикам.

Функция t-распределения Стьюдента имеет довольно сложную для понимания формулу, поэтому не имеет смысла ее разбирать. Вероятности и квантили t-критерия приведены в специальных таблицах распределения Стьюдента и забиты в функции разных ПО вроде Excel.

Итак, вооружившись новыми знаниями, вы сможете понять официальное определение распределения Стьюдента.
Случайной величиной, подчиняющейся распределению Стьюдента с k степенями свободы, называется отношение независимых случайных величин

где x распределена по стандартному нормальному закону, а ch 2 _k подчиняется распределению ch 2 c k степенями свободы.

Таким образом, формула критерия Стьюдента для средней арифметической

есть частный случай стьюдентова отношения

Из формулы и определения следует, что распределение т-критерия Стьюдента зависит лишь от количества степеней свободы.

При k > 30 t-критерий практически не отличается от стандартного нормального распределения.

В отличие от хи-квадрат, t-критерий может быть одно- и двусторонним. Обычно пользуются двусторонним, предполагая, что отклонение может происходить в обе стороны от средней. Но если условие задачи допускает отклонение только в одну сторону, то разумно применять односторонний критерий. От этого немного увеличивается мощность критерия.

Условия применения t-критерия Стьюдента

Несмотря на то, что открытие Стьюдента в свое время совершило переворот в статистике, t-критерий все же довольно сильно ограничен в возможностях применения, т.к. сам по себе происходит из предположения о нормальном распределении исходных данных. Если данные не являются нормальными (что обычно и бывает), то и t-критерий уже не будет иметь распределения Стьюдента. Однако в силу действия центральной предельной теоремы средняя даже у ненормальных данных быстро приобретает колоколообразную форму распределения.

Рассмотрим, для примера, данные, имеющие выраженный скос вправо, как у распределения хи-квадрат с 5-ю степенями свободы.

Теперь создадим 20 тысяч выборок и будет наблюдать, как меняется распределение средних в зависимости от их объема.

Отличие довольно заметно в малых выборках до 15-20-ти наблюдений. Но дальше оно стремительно исчезает. Таким образом, ненормальность распределения – это, конечно, нехорошо, но некритично.

Картина получается нерадостная. Фактические частоты средних сильно отличаются от теоретических. Использование t-распределения в такой ситуации становится весьма рискованной затеей.

Итак, в не очень малых выборках (от 15-ти наблюдений) t-критерий относительно устойчив к ненормальному распределению исходных данных. А вот выбросы в данных сильно искажают распределение t-критерия, что, в свою очередь, может привести к ошибкам статистического вывода, поэтому от аномальных наблюдений следует избавиться. Часто из выборки удаляют все значения, выходящие за пределы ±2 стандартных отклонения от средней.

Пример проверки гипотезы о математическом ожидании с помощью t- критерия Стьюдента в MS Excel

В Excel есть несколько функций, связанных с t-распределением. Рассмотрим их.

СТЬЮДЕНТ.РАСП.2Х – двухсторонне распределение. В качестве аргумента подается абсолютное значение (по модулю) t-критерия и количество степеней свободы. На выходе получаем вероятность получить такое или еще больше значение t-критерия (по модулю), т.е. фактический уровень значимости (p-value).

СТЬЮДЕНТ.РАСП.ПХ – правостороннее t-распределение. Так, 1-СТЬЮДЕНТ.РАСП(2;5;1) = СТЬЮДЕНТ.РАСП.ПХ(2;5) = 0,05097. Если t-критерий положительный, то полученная вероятность – это p-value.

СТЬЮДЕНТ.ОБР – используется для расчета левостороннего обратного значения t-распределения. В качестве аргумента подается вероятность и количество степеней свободы. На выходе получаем соответствующее этой вероятности значение t-критерия. Отсчет вероятности идет слева. Поэтому для левого хвоста нужен сам уровень значимости a, а для правого 1 — a.

СТЬЮДЕНТ.ОБР.2Х – обратное значение для двухстороннего распределения Стьюдента, т.е. значение t-критерия (по модулю). Также на вход подается уровень значимости a. Только на этот раз отсчет ведется с двух сторон одновременно, поэтому вероятность распределяется на два хвоста. Так, СТЬЮДЕНТ.ОБР(1-0,025;5) = СТЬЮДЕНТ.ОБР.2Х(0,05;5) = 2,57058

СТЬЮДЕНТ.ТЕСТ – функция для проверки гипотезы о равенстве математических ожиданий в двух выборках. Заменяет кучу расчетов, т.к. достаточно указать лишь два диапазона с данными и еще пару параметров. На выходе получим p-value.

ДОВЕРИТ.СТЬЮДЕНТ – расчет доверительного интервала средней с учетом t-распределения.

Рассмотрим такой учебный пример. На предприятии фасуют цемент в мешки по 50кг. В силу случайности в отдельно взятом мешке допускается некоторое отклонение от ожидаемой массы, но генеральная средняя должна оставаться 50кг. В отделе контроля качества случайным образом взвесили 9 мешков и получили следующие результаты: средняя масса (X?) составила 50,3кг, среднеквадратичное отклонение (s) – 0,5кг.

Согласуется ли полученный результат с нулевой гипотезой о том, что генеральная средняя равна 50кг? Другими словами, можно ли получить такой результат по чистой случайности, если оборудование работает исправно и выдает среднее наполнение 50 кг? Если гипотеза не будет отклонена, то полученное различие вписывается в диапазон случайных колебаний, если же гипотеза будет отклонена, то, скорее всего, в настройках аппарата, заполняющего мешки, произошел сбой. Требуется его проверка и настройка.

Краткое условие в обще принятых обозначениях выглядит так.

Есть основания предположить, что распределение заполняемости мешков подчиняются нормальному распределению (или не сильно от него отличается). Значит, для проверки гипотезы о математическом ожидании можно использовать t-критерий Стьюдента. Случайные отклонения могут происходить в любую сторону, значит нужен двусторонний t-критерий.

Вначале применим допотопные средства: ручной расчет t-критерия и сравнение его с критическим табличным значением. Расчетный t-критерий:

Теперь определим, выходит ли полученное число за критический уровень при уровне значимости a = 0,05. Воспользуемся таблицей для критерия Стьюдента (есть в любом учебнике по статистике).

По столбцам идет вероятность правой части распределения, по строкам – число степеней свободы. Нас интересует двусторонний t-критерий с уровнем значимости 0,05, что равносильно t-значению для половины уровня значимости справа: 1 — 0,05/2 = 0,975. Количество степеней свободы – это объем выборки минус 1, т.е. 9 — 1 = 8. На пересечении находим табличное значение t-критерия – 2,306. Если бы мы использовали стандартное нормальное распределение, то критической точкой было бы значение 1,96, а тут она больше, т.к. t-распределение на небольших выборках имеет более приплюснутый вид.

Сравниваем фактическое (1,8) и табличное значение (2.306). Расчетный критерий оказался меньше табличного. Следовательно, имеющиеся данные не противоречат гипотезе H₀ о том, что генеральная средняя равна 50 кг (но и не доказывают ее). Это все, что мы можем узнать, используя таблицы. Можно, конечно, еще p-value попробовать найти, но он будет приближенным. А, как правило, именно p-value используется для проверки гипотез. Поэтому далее переходим в Excel.

Готовой функции для расчета t-критерия в Excel нет. Но это и не страшно, ведь формула t-критерия Стьюдента довольно проста и ее можно легко соорудить прямо в ячейке Excel.

Получили те же 1,8. Найдем вначале критическое значение. Альфа берем 0,05, критерий двусторонний. Нужна функция обратного значения t-распределения для двухсторонней гипотезы СТЬЮДЕНТ.ОБР.2Х.

Полученное значение отсекает критическую область. Наблюдаемый t-критерий в нее не попадает, поэтому гипотеза не отклоняется.

Однако это тот же способ проверки гипотезы с помощью табличного значения. Более информативно будет рассчитать p-value, т.е. вероятность получить наблюдаемое или еще большее отклонение от средней 50кг, если эта гипотеза верна. Потребуется функция распределения Стьюдента для двухсторонней гипотезы СТЬЮДЕНТ.РАСП.2Х.

P-value равен 0,1096, что больше допустимого уровня значимости 0,05 – гипотезу не отклоняем. Но теперь можно судить о степени доказательства. P-value оказался довольно близок к тому уровню, когда гипотеза отклоняется, а это наводит на разные мысли. Например, что выборка оказалась слишком мала для обнаружения значимого отклонения.

Пусть через некоторое время отдел контроля снова решил проверить, как выдерживается стандарт заполняемости мешков. На этот раз для большей надежности было отобрано не 9, а 25 мешков. Интуитивно понятно, что разброс средней уменьшится, а, значит, и шансов найти сбой в системе становится больше.

Допустим, были получены те же значения средней и стандартного отклонения по выборке, что и в первый раз (50,3 и 0,5 соответственно). Рассчитаем t-критерий.

Критическое значение для 24-х степеней свободы и a = 0,05 составляет 2,064. На картинке ниже видно, что t-критерий попадает в область отклонения гипотезы.

Можно сделать вывод о том, что с доверительной вероятностью более 95% генеральная средняя отличается от 50кг. Для большей убедительности посмотрим на p-value (последняя строка в таблице). Вероятность получить среднюю с таким или еще большим отклонением от 50, если гипотеза верна, составляет 0,0062, или 0,62%, что при однократном измерении практически невозможно. В общем, гипотезу отклоняем, как маловероятную.

Расчет доверительного интервала для математического ожидания с помощью t-распределения Стьюдента в Excel

С проверкой гипотез тесно связан еще один статистический метод – расчет доверительных интервалов. Если в полученный интервал попадает значение, соответствующее нулевой гипотезе, то это равносильно тому, что нулевая гипотеза не отклоняется. В противном случае, гипотеза отклоняется с соответствующей доверительной вероятностью. В некоторых случаях аналитики вообще не проверяют гипотез в классическом виде, а рассчитывают только доверительные интервалы. Такой подход позволяет извлечь еще больше полезной информации.

Рассчитаем доверительные интервалы для средней при 9 и 25 наблюдениях. Для этого воспользуемся функцией Excel ДОВЕРИТ.СТЬЮДЕНТ. Здесь, как ни странно, все довольно просто. В аргументах функции нужно указать только уровень значимости a, стандартное отклонение по выборке и размер выборки. На выходе получим полуширину доверительного интервала, то есть значение которое нужно отложить по обе стороны от средней. Проведя расчеты и нарисовав наглядную диаграмму, получим следующее.

Как видно, при выборке в 9 наблюдений значение 50 попадает в доверительный интервал (гипотеза не отклоняется), а при 25-ти наблюдениях не попадает (гипотеза отклоняется). При этом в эксперименте с 25-ю мешками можно утверждать, что с вероятностью 97,5% генеральная средняя превышает 50,1 кг (нижняя граница доверительного интервала равна 50,094кг). А это довольно ценная информация.

Таким образом, мы решили одну и ту же задачу тремя способами:

1. Древним подходом, сравнивая расчетное и табличное значение t-критерия
2. Более современным, рассчитав p-value, добавив степень уверенности при отклонении гипотезы.
3. Еще более информативным, рассчитав доверительный интервал и получив минимальное значение генеральной средней.

Важно помнить, что t-критерий относится к параметрическим методам, т.к. основан на нормальном распределении (у него два параметра: среднее и дисперсия). Поэтому для его успешного применения важна хотя бы приблизительная нормальность исходных данных и отсутствие выбросов.

Напоследок предлагаю видеоролик о том, как рассчитать критерий Стьюдента и проверить гипотезу о генеральной средней в Excel.

Иногда просят объяснить, как делаются такие наглядные диаграммы с распределением. Ниже можно скачать файл, где проводились расчеты для этой статьи.

Сегодня мы говорим о t-критерии. Т-критерий наиболее популярный статистический тест в биомедицинских исследованиях. Также его называют парный Т-критерий Стьюдента, t-test, two-sample unpaired t-test. Однако, при использовании этого статистического инструмента допускается достаточно много ошибок. Сегодня в этой статье мы постараемся разобраться, как избежать ошибок применения t-критерия Стьюдента, как интерпретировать его результаты и как рассчитывать t-критерий самостоятельно. Об этом обо всем читайте далее.

При описании любого статистического критерия, будь то t-критерий Стьюдента, либо какой-либо еще, нужно вспомнить о том, как же вообще используются статистические критерии. Для того, чтобы понять, как используется любой критерий, нужно перейти к нескольким достаточно логичным для понимания этапам:

Этапы статистического вывода (statistic inference)

Первый из них – это вопрос, который мы хотим изучить с помощью статистических методов. То есть первый этап: что изучаем? И какие у нас есть предположения относительно результата? Этот этап называется этап статистических гипотез.
Второй этап – нужно определиться с тем, какие у нас есть в реальности данные для того, чтобы ответить на первый вопрос. Этот этап – тип данных.
Третий этап состоит в том, чтобы выбрать корректный для применения в данной ситуации статистический критерий.
Четвертый этап это логичный этап применения интерпретации любой формулы, какие результаты мы получили.
Пятый этап это создание, синтез выводов относительно первого, второго, третьего, четвертого, пятого этапа, то есть что же получили и что же это в реальности значит.

Предлагаю долго не ходить вокруг да около и посмотреть применение t-критерия Стьюдента на реальном примере.

Видео-версия статьи

Пример использования т-критерия Стьюдента

А пример будет достаточно простой: мне интересно, стали ли люди выше за последние 100 лет. Для этого нужно подобрать некоторые данные. Я обнаружил интересную информацию в достаточно известной статье The Guardian (Tall story’s men and women have grown taller over last century, Study Shows (The Guardian, July 2016), которая сравнивает средний возраст человека в разных странах в 1914 году и в аналогичных странах в 2014 году.

Там приведены данные практически по всем государствам. Однако, я взял лишь 5 стран для простоты вычислений: это Россия, Германия, Китай, США и ЮАР, соответственно 1914 год и 2014 год.

Общее количество наблюдений – 5 в 1914 году в группе 1914 года и общее значение также 5 в 2014 году. Будем думать опять же для простоты, что эти данные сопоставимы, и с ними можно работать.

Дальше нужно выбрать критерии – критерии, по которым мы будем давать ответ. Равны ли средние по росту в 1914 году x?₁₉₁₄ и в 2014 году x?₂₀₁₄. Я считаю, что нет. Поэтому моя гипотеза это то, что они не равны (x?₁₉₁₄?x?₂₀₁₄). Соответственно альтернативная гипотеза моему предположению, так называемая нулевая гипотеза (нулевая гипотеза консервативна, обратная вашей, часто говорит об отсутствии статистически значимых связей/зависимостей) будет говорить о том, что они между собой на самом деле равны (x?₁₉₁₄=x?₂₀₁₄), то есть о том, что все эти находки случайны, и я, по сути, не прав.

Теперь нужно дать какой-то аргументированный ответ. Даем его с помощью статистического критерия. Соответственно теперь наступает самое важное: как выбрать статистический критерий? Я думаю, это будет темой отдельной статьи. Для корректности использования t-критерия Стьюдента лишь скажу, что нужно, чтобы:

Условия применения статистического критерия т-теста (критерия Стьюдента)

— данные распределялись по закону нормального распределения;

— данные были количественными;

— и это две независимые между собой выборки (независимые это значит, что в этих группах разные люди, а никак, например, до и после применения препарата у одной группы, люди должны быть разными, тогда группы являются несвязанными, либо независимыми), этот аспект стоит учитывать для выбора вида т-критерия Стьюдента, так как для парных выборок существует свой парный т-критерий (paired t-test).

В итоге Мы определились с тем, что это будет t-критерий Стьюдента.

Формула t-критерия Стьюдента достаточно простая. Она гласит о том, что в числителе у нас разница средних, в знаменателе у нас корень квадратный суммы ошибок репрезентативности по этим группам:

Ошибки репрезентативности были подробно объяснены мною в статье по доверительным интервалам. Поэтому я рекомендую вам ознакомиться с ней, чтобы лучше разобраться, что такое ошибки репрезентативности, что такое выборка, как она соотносится с генеральной совокупностью.

Для того, чтобы не тратить время, я в принципе все уже рассчитал по каждой из групп: средняя (x?) ,стандартное отклонение (SD) и ошибка репрезентативности (m r ).

Давайте остановимся на том, что же значат эти значения:

— средняя (x?) это среднеарифметическое по 5 наблюдениям в каждой группе;

— если совсем упрощать значение стандартного отклонения (SD), то можно сказать, что оно представляет собой обобщенную среднюю отклонения каждого значения от среднего (стандартное отклонение показывает, насколько широко значения рассеяны (разбросаны) относительно средней). И дальше мы находим нечто среднее отклонений каждого варианта в группе от среднего;

— и ошибка репрезентативности она тоже находится достаточно просто: это как раз наше отклонение от средней некоторое стандартизованное, поэтому стандартное отклонение на размер выборки (m_r=).

Итак, продолжаем. В ходе подстановки каждого значения в нашу формулу, мы находим, что t-критерий Стьюдента равен 3,78. Однако, я думаю, пока тем, кто не знаком со статистическими критериями, это мало о чем говорит.

Итак, как нам перейти от нашей t к р вероятности? Это сделать достаточно просто, стоит лишь воспользоваться табличными значениями t для определенных степеней свободы. Теперь вопрос: как найти эти степени свободы? Но это сделать достаточно просто. Для того, чтобы обнаружить степени свободы для наших групп, нужно лишь сложить количество наблюдений 5 и 5 в нашем случае и вычесть 2. В нашем случае степень свободы равна 8.

Итак, t=3,78, степень свободы равна 8. Переходим в табличное значение и получаем р вероятность – вероятность равна 0,005. То есть вероятность того, что мы ошибаемся при констатации факта различия роста ранее и сейчас, крайне мала – это 0,005 %, не 5 %, а 0,005 %. То есть мы можем говорить с высокой долей достоверности того, что наш рост сейчас в XXI веке и 100 лет назад отличаются.

Вот то, что касается расчета t-критерия Стьюдента и его интерпретации.

На этом наш разговор о t-критерии Стьюдента закончен. Спасибо, что ознакомились с этой статьей. Я очень надеюсь на вашу обратную связь. Пожалуйста, подписывайтесь на наш сайте, ставьте лайки, предлагайте свои темы для следующих выпусков. Спасибо большое за поддержку. С вами был Кирилл Мильчаков. Пока, до новых встреч!

Если Вам понравилась статья и оказалась полезной, Вы можете поделиться ею с коллегами и друзьями в социальных сетях:

Читайте также: