Рецензируемый медицинский научно-практический журнал



Pdf көрінісі
бет2/26
Дата04.01.2017
өлшемі7,91 Mb.
#1160
1   2   3   4   5   6   7   8   9   ...   26

Ключевые  слова:  Statistica,  SPSS,  критерии  Стьюдента,  критерий  Манна-Уитни, 
независимые группы. 
 
Summary 
ANALYSIS OF QUANTITATIVE DATA IN TWO 
INDEPENDENT SAMPLES USING STATISTICA AND SPSS 
SOFTWARE: PARAMETRIC AND NON-PARAMETRIC TESTS 
 
Andrej M. Grjibovski 
1-4
,
 
http://orcid.org/0000-0002-5464-0498,
 
Sergej V. Ivanov 
5

http://orcid.org/0000-0003-0254-3941
 
Maria A. Gorbatova 
2
,
 
http://orcid.org/0000-0002-6363-9595
 
 
1
Norwegian Institute of Public Health, Oslo, Norway; 
2
Northern State Medical University, Arkhangelsk, Russia; 
3
North-Eastern Federal University, Yakutsk, Russia; 
4
International Kazakh-Turkish University, Turkestan, Kazakhstan; 
5
North-Western State Medical University n.a. I.I. Mechnikov, St. Petersburg, Russia. 
 
This is the second paper of the series of articles where we present basic principles of statistical data 
analysis  using  Statistica  and  SPSS  software  for  beginners.  Step-be-step  algorithms  for  Student’s 
unpaired t-test and Mann-Whitney test for independent samples are presented. The main aim of this 

Research methodology 
Science & Healthcare, 2, 2016
 

 
paper is to provide basic knowledge on ho to compare continuous variables in two independent samples 
with  practical  examples  using  commonly  used  software.  The  article  complements,  but  does  not 
substitute specialized literature on biostatistics and clinical epidemiology. 
 
Keywords: Statistica, SPSS, t-test, Mann-Whitney test, independent samples. 
 
Түйіндеме 
STATISTICA И SPSS БАҒДАРЛАМАЛЫҚ ҚАМТАМАСЫЗ 
ЕТУДІ ҚОЛДАНУМЕН ЕКІ ТӘУЕЛСІЗ ІРІКТЕМЕЛЕРДІҢ 
САНДЫҚ МӘЛІМЕТТЕРІН САЛЫСТЫРУ: ПАРАМЕТРЛІК 
ЖӘНЕ ПАРАМЕТРЛІК ЕМЕС КРИТЕРИЛЕР 
 
Андрей М. Гржибовский
1-4

http://orcid.org/0000-0002-5464-0498, 
Сергей В. Иванов
5
,
 
http://orcid.org/0000-0003-0254-3941
 
Мария А. Горбатова
2
,
 
http://orcid.org/0000-0002-6363-9595
 
 

Қоғамдық Денсаулық сақтау Ұлттық Институты, Осло қ., Норвегия;
 

Солтүстік Мемлекеттік Медициналық Университеті, Архангельск қ., Ресей;
 

Х.А. Ясави ат. Халықаралық Қазақ –
 
Түрік Университеті, Туркестан, Қазақстан;
 
4
 
Солтүстік
 - 
Шығыс Федералдық Университеті, Якутск
 
қ., Ресей;
 

И.
 
И. Мечников атынд. Солтүстік –
 
Батыс мемлекеттік медициналық 
университеті, Санкт
-
Петербург қ., Ресей.
 
 
Осы жұмыста тәуелсіз іріктемелердің сандық белгілерін салыстыру үшін Стьюдент параметрлік 
қосарлы  емес  критерилерін  және  Манна-Уитни  параметрлік  емес  критерилерін  қолдану  туралы 
жалпы  мәліметтер  берілген.  Statistica  10  және  SPSS  20  бағдарламалық  қамтамасыз  етуді 
пайдаланумен  критерилер  мәліметтері  есебінің  алгоритмі  суреттелген  және  есептер 
нәтижелерінің интерпретациясы берілген. Осы мақала Стьюдент және Манна-Уитни критерилерін 
қолдану  туралы  жалпы  мәліметтер  беруге  талап  етілген  және  статистика  және  клиникалық 
эпидемиология бойынша мамандандырылған әдебиетті оқудың орнын баспайды.  
 
Негізгі сөздер: Statistica, SPSS, Стьюдент критерилері, Манна-Уитни критериі, тәуелсіз топтар. 
 
 
Библиографическая ссылка: 
Гржибовский  А.  М.,  Иванов  С.  В.,  Горбатова  М.  А.  Сравнение  количественных  данных  двух 
независимых выборок с использованием программного обеспечения Statistica и SPSS: параметрические и 
непараметрические критерии / / Наука и Здравоохранение. 2016. №2. С. 5-28. 
Grjibovski  A.  M.,  Ivanov  S.  V.,  Gorbatova  M.  A.  Analysis  of  quantitative  data  in  two  independent  samples 
using Statistica and SPSS software: parametric and non-parametric tests. Nauka i Zdravookhranenie [Science & 
Healthcare]. 2016, 2, pp. 5-28. 
Гржибовский А. М., Иванов С. В., Горбатова М. А. Statistica и SPSS бағдарламалық қамтамасыз етуді 
қолданумен екі тәуелсіз іріктемелердің сандық мәліметтерін салыстыру: параметрлік және параметрлік 
емес критерилер / / Ғылым және Денсаулық сақтау. 2016. №2. Б. 5-28. 
 
 
Настоящая  статья  продолжает  серию 
публикаций  [11],  посвященных  статистическо-
му 
анализу 
данных 
биомедицинских 
исследований.  Цель  данной  серии  статей  – 
формирование у начинающего исследователя 
базисных  представлений  о  статистическом 
анализе  данных,  приобретение  читателем 
практического 
опыта 
использования 
современного  статистического  программного 
обеспечения  и  предупреждение  типичных 

Наука и Здравоохранение, 2, 2016 
Методология научных исследований
 

 
ошибок, 
возникающих 
в 
процессе 
статистической обработки данных. 
Для 
более 
полного 
понимания 
представленного 
материала, 
авторы 
настоящей  статьи  настоятельно  рекомендуют 
читателю  предварительно  ознакомиться  с 
литературой  по  эпидемиологии  [25,  16,  29]. 
Практические  аспекты  организации  и  анализа 
результатов  различных  типов  научных 
исследований 
в 
здравоохранении 
(одномоментных,  когортных,  экологических, 
экспериментальных  исследований  и  «случай-
контроль»)  представлены  в  серии  статей, 
опубликованной  в  журнале  «Наука  и 
Здравоохранение»  в  2015  году  [8,  9,  10,  12, 
13]. 
Вопросы 
корректной 
статистической 
обработки 
данных 
исследований 
в 
здравоохранении  актуальны  не  только  в 
Казахстане,  но  и  в  странах  СНГ,  Европы  и 
США,  и  высокое  качество  статистического 
анализа  является  обязательным  условием 
востребованности  научных  результатов  и 
транспарентности 
научных 
достижений 
отдельных 
исследователей 
и 
исследовательских 
коллективов 
в 
международном научном сообществе [20, 1].  
Настоящая  статья  посвящена  вопросу 
сравнения  количественных  данных  двух 
независимых 
групп 
с 
использованием 
программного  обеспечения  Statistica  10  и 
SPSS 20. 
Любое  хорошо  организованное  научное 
исследование  имеет  определенный  план,  и 
еще  на  этапе  планирования  формулируется 
исследовательская  гипотеза.  Примерами 
исследовательских 
гипотез 
служат 
утверждения  «препарат  A  эффективнее 
препарата  B»,  «в  городе  С  заболеваемость 
туберкулезом  выше,  чем  в  городе  D», 
«курение 
повышает 
риск 
развития 
артериальной  гипертензии»  и  т.п.  Целью 
любого  исследования  является  проверка 
данной  гипотезы,  и  в  результате  сбора  и 
обработки 
исследовательских 
данных 
гипотеза будет либо принята, либо отклонена. 
Ключевую 
роль 
в 
проверке 
исследовательской 
гипотезы 
играет 
статистический  анализ  данных.  На  этапе 
статистической 
обработки 
также 
формулируются  2  гипотезы  –  нулевая  (H
0
)  и 
альтернативная  (H
1
)  [4,  24,  28].  Нулевая 
статистическая  гипотеза  предполагает,  что 
различия  между  сравниваемыми  группами 
отсутствуют.  Альтернативная  статистическая 
гипотеза, 
напротив,  предполагает, 
что 
сравниваемые группы различаются. 
Для  принятия  решения  об  отклонении 
нулевой  гипотезы  ориентируются  на  уровень 
статистической 
значимости 
(p). 
Общепринятым 
в 
биомедицинских 
исследованиях 
критическим 
уровнем 
значимости  является  значение 0,05. Если  p  < 
0,05,  это  говорит  о  том,  что  вероятность 
нахождения  различий  там,  где  их  фактически 
нет, составляет не более 5%, и в этом случае 
нулевая  гипотеза  отклоняется  и  принимается 
альтернативная  гипотеза.  Если  p  >  0,05,  то 
принимается  нулевая  гипотеза,  которая 
говорит  о  том,  что  сравниваемые  группы  не 
отличаются  друг  от  друга.  В  ряде  случаев  за 
критический  уровень  значимости  принимают 
значение  0,01  или  0,001,  которые  допускают 
вероятность зафиксировать различия там, где 
их  нет,  не  превышающую  1%  и  0,1% 
соответственно. 
Для  проверки  статистических  гипотез 
используются 
параметрические 
и 
непараметрические критерии. 
Параметрические  критерии  оперируют 
понятиями 
нормального 
(гауссовского) 
распределения  –  средним  арифметическим 
значением  и  стандартным  отклонением. 
Нормальное 
распределение 
имеет 
симметричную  колоколообразную  форму  и 
может  быть  описана  с  помощью  среднего 
арифметического  значения,  стандартного 
отклонения,  либо  доверительных  интервалов 
[7, 24, 6]. Именно по этой причине, прежде чем 
использовать 
параметрические 
методы 
статистики,  исследователь  должен  убедиться 
в  том,  что  распределение  имеющихся  в  его 
распоряжении  данных  не  отличается  от 
нормального 
(способы 
проверки 
распределения 
подробно 
описаны 
в 
предыдущем  выпуске  журнала  «Наука  и 
Здравоохранение»  и  включают  в  себя 
построенние  гистограммы  распределения, 
квантильной  диаграммы,  расчет  критериев 
Шапиро-Уилка и Колмогорова-Смирнова). 
Параметрическим 
критерием 
для 
сравнения  двух  независимых  групп  является 

Research methodology 
Science & Healthcare, 2, 2016
 

 
критерий  Стьюдента.  В  данной  статье  будет 
рассмотрен 
его 
наиболее 
широко 
используемый  вариант  –  непарный  критерий 
Стьюдента  для  сравнения  двух  независимых 
групп.  Также  существует  одновыборочный 
критерий  Стьюдента,  который  используется 
для  сравнения  количественного  признака, 
характеризующего  группу  наблюдения,  с 
определенным  количественным  значением 
[27],  и  парный  критерий  Стьюдента, 
использующийся для сравнения парных групп 
(например,  в  исследованиях  «до-после») 
который  будет  рассмотрен  в  последующих 
выпусках.  
Для  того,  чтобы  использовать  непарный 
критерий Стьюдента, необходимо соблюдение 
следующих условий [6, 26]: 
1.
 
Количественный 
тип 
данных 
(желательно, 
чтобы 
данные 
были 
непрерывными, а не дискретными). 
2.
 
Наличие не более чем двух выборок. 
3.
 
Выборки  должны  быть  независимыми 
друг от друга (например, нельзя использовать 
непарный критерий Стьюдента для сравнения 
«до-после»). 
4.
 
Нормальное 
распределение 
изучаемого  признака  в  популяции,  из  которой 
взяты  выборки  (как  правило,  сведения  о 
распределении 
признака 
в 
популяции 
отсутствуют,  и  поэтому  распределение 
оценивают  в  каждой  из  сравниваемых  групп 
по-отдельности). 
5.
 
Равенство 
дисперсий 
изучаемого 
признака  в  популяциях,  из  которых  взяты 
выборки  (дисперсии  также  оцениваются  в 
каждой 
из 
сравниваемых 
групп 
по-
отдельности).  Современное  программное 
обеспечение 
позволяет 
рассчитывать 
значение  критерия  Стьюдента  и  уровень 
статистической  значимости,  даже  если 
дисперсии не равны. 
Рассчитывается  критерий  Стьюдента  по 
формуле: 
 
t =  
M
1
 – M

√(S
12
/n
1
 + S
22
/n
1

 
где  М
1
  и  M
2
  –  средние  арифметические 
значения количественного признака группы 1 и 
группы 2;  
S
1
 и S
2
 – стандартные отклонения признака 
для группы 1 и группы 2;  
n
1
 и n
2
 – количество наблюдений в группе 1 
и в группе 2 соответственно. 
Расчет 
среднего 
арифметического 
значения для каждой из выборок производится 
по формуле: 
 
M =  
X
1
 + X
2
 + X
3
 + … + X
i
  

 
где  X
1
  …  X
i
  –  значения  количественного 
признака 
в 
группе, 
для 
которой 
рассчитывается  стандартное  отклонение,  n  – 
количество наблюдений в данной группе. 
Расчет  значения  стандартного  отклонения 
для  каждой  из  групп  производится  по 
формуле: 
 
S = √ ( 
(X
1
 – М)
2
 + (X
2
 – М)
2
 + (X
3
 – М)
2
 + … + (X
i
 – М)
2
 


 
После 
расчета 
значения 
критерия 
Стьюдента  также  потребуется  рассчитать 
количество степеней свободы: 
 
df  = (n
1
 – 1) + (n
2
 – 1) 
 
Далее 
используется 
таблица 
t-
распределения,  в  которой,  с  учетом 
количества  степеней  свободы,  сравниваются 
эмпирическое  и  критическое  значение  t:  если 
эмпирическое 
значение 
превышает 
критическое для заданного уровня значимости 
(0,05,  0,01  или  0,001),  то  нулевая  гипотеза 
отклоняется  и  принимается  альтернативная 
гипотеза,  согласно  которой  сравниваемые 
группы  различаются.  Таблицы  значений  t  для 
различных 
уровней 
статистической 
значимости 
приведены 
во 
многих 
руководствах  по  статистике,  например,  в  [23, 
4, 17]. 
Для  наглядного  представления  о  ручном 
методе расчета критерия Стьюдента приведем 
гипотетический пример.  
Допустим,  сравниваются  две  схемы 
лечения  (базисная  и  новая),  и  конечной 
точкой,  по  которой  судят  об  эффективности 

Наука и Здравоохранение, 2, 2016 
Методология научных исследований
 

 
одной  или  другой  схемы  терапии,  является 
срок 
госпитализации. 
Пациенты 
были 
рандомизированы  на  две  группы,  из  которых 
группа 1 (n = 23) получала базисную терапию, 
а  группа  2  (n =  24)  –  новую  схему  терапии. 
Сведения о сроках госпитализации пациентов 
обеих групп представлены в таблице 1. 
 
Таблица 1. 
Сроки госпитализации пациентов, получавших базисную и новую схему терапии. 
Группа 1 
(базисная терапия) 
Группа 2 
(новая схема терапии) 
№ 
пациента 
Срок 
лечения, 
дней 
№ 
пациента 
Срок 
лечения, 
дней 
№ 
пациента 
Срок 
лечения, 
дней 
№ 
пациента 
Срок 
лечения, 
дней 


13 
10 


13 



14 



14 



15 



15 



16 



16 



17 



17 



18 



18 



19 
11 


19 



20 



20 


10 
21 



21 

10 

22 

10 

22 

11 

23 
11 
11 

23 
10 
12 
10 


12 

24 

 
На  основании  имеющихся  данных  по 
вышеприведенным  формулам  рассчитываем 
среднее  арифметическое  значение  для 
каждой  из  групп:  M
1
 = 8,04  дня,  M
2
 = 6,75  дня 
(разница  средних  значений  составляет  1,29 
дня).  
Далее 
рассчитываем 
значение 
стандартного отклонения для каждой из групп: 
S
1
 = 1,77 дня, S
2
 = 1,72 дня. 
Подставляем  полученные  значения  в 
формулу расчета критерия Стьюдента: 
 
t =  
8,04 – 6,75
 
≈ 2,53 
√(1,77
2
/23 + 1,72
2
/24) 
 
Количество степеней свободы: 
 
df  = (23 – 1) + (24 – 1) = 45. 
 
Согласно  табличным  данным  [23,  4,  17], 
для  критического  уровня  статистической 
значимости,  равного  0,05,  и  количества 
степеней  свободы,  равного  45,  критическое 
значение t составляет 2,014, ниже значения  t, 
полученного  в  результате  расчетов,  поэтому 
нулевая  гипотеза  отвергается  и  принимается 
альтернативная 
гипотеза: 
длительность 
госпитализации 
пациентов 
группы 
2, 
получающих  новую  схему  терапии  в  среднем 
на 1,29 дня меньше, чем у пациентов группы 1, 
получающих  базисную  терапию  (t  =  2,53, 
df = 45, p < 0,05). 
Отметим,  что  в 
данном 
примере 
соблюдены все требования, необходимые для 
использования 
критерия 
Стьюдента: 
анализируются 
количественные 
данные, 
сравниваются  две  независимые  выборки 
(независимость  наблюдений  определена  тем, 
что  пациенты  получали  либо  базисную,  либо 
альтернативную  терапию),  признаки  имеют 
распределение,  близкое  к  нормальному  (о 
способах проверки типа распределения будет 
сказано  ниже)  и  дисперсии  сравниваемого 
признака близки друг к другу по значению (так 
как  близки  значения  стандартных  отклонений 
в  сравниваемых  выборках,  а  дисперсия 

Research methodology 
Science & Healthcare, 2, 2016
 
10 
 
является 
квадратом 
стандартного 
отклонения). 
Если 
полученные 
в 
результате 
исследования  данные  не  соответствуют, 
необходимым  условиям  применения  критерия 
Стьюдента,  для  сравнения  двух  несвязанных 
выборок  следует  использовать  методы 
непараметрической  статистики,  которые  не 
требуют наличия нормального распределения 
данных.  Непараметрические  методы  не 
используют  параметры  распределения,  а 
осуществляют  ранжирование  абсолютных 
значений 
признака, 
что 
позволяет 
нивелировать 
эффект 
выскакивающих 
величин 
(«выбросов») 
и 
скошенности 
распределения. 
Конечно, 
методы 
непараметрической 
статистики  могут  быть  использованы  и  при 
наличии 
нормального 
распределения 
количественного  признака,  но  в  таком  случае 
они  будут  иметь  меньшую  мощность  по 
сравнению  с  параметрическими  методами,  то 
есть  могут  не  уловить  имеющиеся  различия 
между группами там, где различия фактически 
присутствуют. 
Для  сравнения  двух  независимых  выборок 
из  непараметрических  методов  наиболее 
часто  используется  критерий  Манна-Уитни. 
Помимо  данного  критерия,  для  сравнения 
несвязанных 
выборок 
могут 
быть 
использованы  и  другие  непараметрические 
критерии  –  непарный  критерий  Вилкоксона, 
критерий  Колмогорова-Смирнова,  критерий 
знаков  и  другие  критерии,  описанные  в 
литературе по статистике [26, 5, 4, 19]. 
Критерий  Манна-Уитни,  как  и  критерий 
Стьюдента, 
имеет 
свои 
особенности 
применения: 
1.
 
Количественный  или  порядковый  тип 
анализируемых данных. 
2.
 
Выборки  должны  быть  независимыми 
друг от друга. 
3.
 
Не 
требуется 
нормальное 
распределение данных.  
Алгоритм расчета критерия Манна-Уитни
1.
 
Значения  переменных  обеих  групп 
объединяются  в  единый  вариационный  ряд  и 
ранжируются  в  порядке  возрастания  или 
убывания. 
2.
 
Абсолютные  значения  переменных 
заменяются рангами. В случае, если несколько 
значений 
равны 
между 
собой, 
им 
присваивается  средний  ранг  из  тех,  которые 
они  получили  бы,  если  бы  не  были  равны 
(пример приведен ниже). 
3.
 
Сумма 
рангов 
подсчитывается 
отдельно для каждой группы. 
4.
 
Значение 
критерия 
Манна-Уитни 
рассчитывается по формуле: 
 
U = n
1
 × n
2
 + 
n
x
 × (n
x
 + 1) 
- T
x
 

 
где  
n
1
  и  n
2
  –  количество  наблюдений  в 
сравниваемых группах,  
T
x
 – большая из двух ранговых сумм,  
n
x
  –  количество  наблюдений  в  группе, 
имеющей большую из двух ранговых сумм. 
5.
 
По 
специальным 
таблицам, 
представленным в руководствах по статистике 
[23, 4, 17], определяется критическое значение 
U  для  определенных  значений  n
1
  и  n
2
  и 
критического  уровня  p.  Если  рассчитанное 
значение  U  меньше  или  равно  критическому, 
то 
нулевая 
статистическая 
гипотеза 
отвергается  и  принимается  альтернативная 
гипотеза, 
свидетельствующая 
о 
существовании различий между группами. 
Для  наглядного  представления  о  ручном 
методе  расчета  критерия  Манна-Уитни 
приведем еще один пример, в котором будут 
представлены  результаты  гипотетического 
плацебо-контролируемого 
исследования, 
направленного  на  оценку  эффективности 
препарата  для  снижения  артериального 
давления  у  пациентов  с  артериальной 
гипертензией I степени. Пациенты группы 1 (n 
=  7)  получали  исследуемый  препарат,  а 
пациенты  группы  2  (n  =  9)  –  плацебо. 
Эффективность  препарата  оценивалась  на 
основании 
динамики 
значения 
систолического  артериального  давления 
(САД) 
после 
курса 
терапии 
препаратом/плацебо. 
Исходные  и  ранжированные  данные  о 
динамике САД пациентов  группы 1 и группы 2 
представлены в Таблице 2. 
 
 


Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   ...   26




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет