Рецензируемый медицинский научно-практический журнал


Наука и Здравоохранение, 2, 2016



Pdf көрінісі
бет3/26
Дата04.01.2017
өлшемі7,91 Mb.
#1160
1   2   3   4   5   6   7   8   9   ...   26

Наука и Здравоохранение, 2, 2016 
Методология научных исследований
 
11 
 
Таблица 2. 
Исходные и ранжированные значения динамики уровня САД пациентов с артериальной 
гипертензией I степени. 
Исходные данные 
Группа 
Группа 1 (препарат) 
Группа 2 (плацебо) 
№ 
пациента 
















Динамика 
САД,  
мм рт. ст 
-7  -8  -11  -15  0  -21  -17  -5 
-8  -14  -3  -6 
-3 
+5  -16  -9 
Ранжированные данные 
Динамика 
САД,  
мм рт. ст 
-21  -17  -16  -15  -14  -11  -9 
-8 
-8 
-7  -6  -5 
-3 
-3 

+5 
Ранг 






7  8,5  8,5  10  11  12  13  14  15  16 
Группа 
















 
Следует 
заметить, 
что 
если 
бы 
исследуемый препарат снижал САД пациентов 
заведомо  сильнее,  чем  плацебо,  то  все 
значения, 
соответствующие 
группе 
1, 
расположились  бы  в  левой  части  строки 
«Ранг»,  в  соответствующие  группе  2  –  в 
правой  части,  но  подобного  распределения 
рангов  фактически  не  наблюдается.  Расчет 
критерия  Манна-Уитни  позволяет  оценить 
вероятность  того,  что  распределение  рангов 
случайно, 
или 
они 
расположены 
определенным 
образом, 
что 
является 
следствием  действия  определенного  фактора 
(в данном случае – исследуемого препарата). 
На  основании  таблицы  1  рассчитывается 
сумма рангов для каждой из групп: для группы 
1  –  46,5,  для  группы  2  –  89,5.  В  группе  2 
ранговая  сумма  оказалась  больше,  поэтому 
используем ее для расчета значения критерия 
Манна-Уитни:  
 
U = 7 × 9 + 
9 × (9 + 1) 
- 89,5 = 18,5 

 
Критическое значение U для n
1
 = 7 и  n
2
 = 9 
составляет  12  [23,  4,  17].  Рассчитанное 
значение 

превышает 
критическое, 
следовательно, 
принимается 
нулевая 
гипотеза,  свидетельствующая  об  отсутствии 
различий между группами (p > 0,05). 
Таким 
образом, 
возвращаясь 
к 
особенностям 
использования 
параметрических 
и 
непараметрических 
критериев,  можно  выделить  три  этапа 
проведения  сравнения  двух  независимых 
групп: 
1.
 
Убеждаемся в том, что анализируемые 
данные  являются  количественными,  а  группы 
– независимыми. 
2.
 
Оцениваем 
распределение 
переменной в обеих группах: если оно близко 
к  нормальному  распределению,  то  следует 
использовать  параметрические  методы,  если 
нет – методы непараметрической статистики. 
3.
 
Используем 
параметрический 
критерий,  если  в  обеих  группах  близко  к 
нормальному, 
или 
непараметрический 
критерий,  если  распределение  переменной 
отличается от нормального.  
Возможна  ситуация,  когда  распределение 
данных  похоже  на  нормальное,  но  скошено 
(пик 
колоколообразного 
распределения 
смещен 
влево 
относительно 
центра 
гистограммы при правосторонней асимметрии 
или вправо при левосторонней асимметрии). В 
таком 
случае 
возможно 
проведение 
трансформации данных таким образом, чтобы 
распределение стало похожим на нормальное, 
чтобы обеспечить возможность использования 
методов 
параметрической 
статистики, 
обладающих 
большей 
мощностью 
по 
сравнению  с  непараметрическими  методами. 
При  правосторонней  асимметрии  извлекают 
квадратный  корень  из  значений  признака, 
проводят  логарифмическое  преобразование  с 
использованием 
натурального 
или 
десятичного  логарифма,  или  осуществляют 
гармоническое  преобразование  по  формуле   

Research methodology 
Science & Healthcare, 2, 2016
 
12 
 
x’  =  - 
1
/
x
.  При  левосторонней  симметрии 
данные  возводят  во  вторую  или  третью 
степень  [7].  Подбор  того  или  иного  способа 
«нормализации» распределения, как правило, 
проводят  эмпирически.  При  этом  следует 
учитывать,  что  преобразование  данных 
должно  быть  произведено  одним  и  тем  же 
способом одновременно в обеих группах. 
Также  возможны  ситуации,  когда  для 
сравнения  данных  используются  методы 
непараметрической  статистики,  а  для  их 
представления 
требуется 
использовать 
параметры  нормального  распределения,  хотя 
фактическое  распределение  отличается  от 
нормального.  В  качестве  примера  подобной 
ситуации 
можно 
привести 
результаты 
исследования, 
посвященного 
проблеме 
кариеса  у  детей  и  подростков  Северо-
Западного региона России, опубликованные в 
2011-2012  гг.  [31,  32,  33].  В  результатах 
исследования представлены значения индекса 
КПУ  («кариес-пломбы-удаленные»).  Данный 
индекс используется Всемирной организацией 
здравоохранения 
(ВОЗ) 
для 
оценки 
интенсивности  кариозного  поражения  зубов  у 
различных  контингентов  населения.  Для 
представления 
описательной 
статистики 
индекса  КПУ  для  различных  категорий 
детского  и  подросткового  населения  в 
публикациях  было  использовано  среднее  
арифметическое  значение  и  его  95% 
доверительный 
интервал, 
а 
для 
статистического 
сравнения 
различных 
категорий детского и подросткового населения 
–  непараметрический  критерий  Манна-Уитни. 
В 
данном 
случае 
использование 
непараметрического  критерия  обусловлено 
обнаруженным 
отличием 
фактического 
распределения  значений  индекса  КПУ  от 
нормального, а представление данных в виде 
среднего 
арифметического 
значения 
продиктовано  требованиями  ВОЗ  описывать 
индекс КПУ как признак, имеющий нормальное 
распределение.  Подобное  требование  имеет 
важное  практическое  значение,  так  как 
проведение  сравнительной  оценки  состояния 
общественного здоровья в различных странах 
требует использования единых статистических 
подходов, 
а 
показатели 
нормального 
распределения  в  данном  случае  являются 
наиболее предпочтительными. 
Для приобретения читателем практических 
навыков 
проведения 
статистического 
сравнения  двух  независимых  выборок 
количественных  переменных,  в  качестве 
практического  примера  будет  рассмотрен 
фрагмент  данных,  которые  были  собраны  в 
процессе 
крупного 
исследования, 
направленного  на  изучение  метаболического 
синдрома  и  его  детерминант  в  условиях 
неблагополучной 
социально-экологической 
ситуации в Южном Казахстане [15, 18, 14, 22]. 
В  ходе  данного  исследования  получены 
значения индекса массы тела (ИМТ) и уровня 
холестерина 
крови 
(непрерывные 
количественные  признаки)  68  мужчин  и  230 
женщин (всего 298 пациентов). 
В  практическом  разделе  настоящей 
публикации  будет  проведено  сравнение 
значений  ИМТ  и  уровня  холестерина  крови  у 
включенных в исследование мужчин и женщин 
(независимые  группы)  с  использованием 
программного  обеспечения  Statistica  10  [21,  2] 
и SPSS 20 [3].  Данные  пакеты  статистических 
программ  являются  инструментами  анализа 
данных, 
удобных 
в 
использовании 
начинающими  исследователями,  не  требуют 
специального  образования  и  приобрели 
заслуженную 
популярность 
среди 
исследователей  стран  СНГ,  работающих  в 
области  медицины.  Демо-версии  программ 
Statistica  и  SPSS  можно  загрузить  с 
официальных 
сайтов 
разработчиков 
(www.stаstsoft.com 
и 
www.ibm.com 
соответственно). 
Следует  отметить,  что  представленные 
ниже  алгоритмы  действий  являются  только 
инструментом  анализа  данных,  так  как 
корректная 
интерпретация 
полученных 
результатов требует наличия базисных знаний 
в  области  биомедицинской  статистики, 
которые  могут  быть  получены  только  путем 
изучения  специализированной  литературы  [4, 
30, 18, 17, 28]. 
Сравнение  2-х  независимых  групп  с 
использованием программы Statistica 10. 
Для  начала  работы  необходимо  открыть 
файл  2_BMI_chol_STAT.sta,  который  следует 
загрузить  с  сайта  журнала  «Наука  и 
Здравоохранение». 
В 
данном 
файле 
представлены  следующие  вариационные 
ряды: 

Наука и Здравоохранение, 2, 2016 
Методология научных исследований
 
13 
 
1.
 
Пол  пациента  (переменная  «Gender»): 
значение  «1»  соответствует  мужчинам, 
значение  «2»  –  женщинам  (переменная 
является номинальной дихотомической). 
2.
 
ИМТ  пациентов  (переменная  «BMI»): 
непрерывная количественная переменная. 
3.
 
Уровень 
холестерина 
крови 
(переменная  «Cholesterol»):  непрерывная 
количественная переменная. 
Задача  статистического  анализа  данных  – 
выяснить,  различаются  ли  включенные  в 
исследование  мужчины  и  женщины  по 
значению  ИМТ  и  уровню  холестерина.  Таким 
образом, 
сравниваемыми 
переменными 
являются  ИМТ  и  уровень  холестерина,  а  пол 
является 
группирующей 
дихотомической 
переменной. 
На  первом  этапе  обработки  данных 
следует  выбрать  метод  статистического 
анализа,  и  для  этого  необходимо  определить 
тип  распределения  (алгоритм  проверки  типа 
распределения 
подробно 
описан 
в 
предыдущей статье настоящей серии [11]). 
Краткое описание действий: 
1.
 
Вход 
в 
раздел 
описательной 
статистики. 
Выбираем  меню  «Statistics»  и  входим  в 
раздел 
«Basic 
Statistics/Tables», 
в 
появившемся 
окне 
выбираем 
раздел 
«Descriptive  Statistics»  и  подтверждаем  выбор 
нажатием на кнопку «ОК». 
2.
 
Выбор  вариационных  рядов  для 
анализа. 
В окне «Descriptive Statistics» нажимаем на 
кнопку  «Variables»  (в  левом  верхнем  углу 
окна), после чего наводим мышь на  название 
вариационного  ряда  «BMI»,  выделяем  его 
нажатием  на  левую  кнопку  мыши,  затем 
наводим мышь на «Cholesterol», и, удерживая 
на  клавиатуре  кнопку  «Ctrl»,  снова  нажимаем 
на  левую  кнопку  мыши,  после  чего 
подтверждаем  выбор  вариационных  рядов 
нажатием на кнопку «ОК». 
3.
 
Настройка  расчета  статистических 
критериев  для  проверки  распределения  на 
«нормальность». 
В окне «Descriptive Statistics» нажимаем на 
вкладку  «Normality»  и  проставляем  галочки 
напротив  позиций,  соответствующих  расчету 
значений  критериев  Колмогорова-Смирнова 
(Kolmogorov-Smirnov  &  Lilliefors  test  for 
normality)  и  Шапиро-Уилка  (Shapiro-Wilk’s  W 
test). 
4.
 
Настройка 
параметров 
вывода 
показателей описательной статистики. 
Нажимаем  на  вкладку  «Advanced»  и 
проставляем 
галочки, 
соответствующие 
выводу показателей описательной статистики: 
среднего  арифметического  значения  (Mean), 
медианы  (Median),  стандартного  отклонения 
(Standard  Deviation),  степени  асимметрии 
(Skewness)  и  эксцесса  (островершинности) 
распределения  (Kurtosis),  верхнего  и  нижнего 
квартилей (Lower & upper quartiles). 
5.
 
Настройка  вывода  вышеперечислен-
ных  статистических  критериев,  графиков  и 
показателей  описательной  статистики  для 
группы мужчин и женщин по-отдельности. 
В окне «Descriptive Statistics» нажимаем на 
кнопку  «By  Group»,  в  появившемся  окне 
нажимаем  на  кнопку  «Grouping  Variable(s)», 
выбираем  вариационный  ряд  «Gender»  и 
подтверждаем  выбор  нажатием  на  кнопку 
«OK».  Далее  в  окне  «By  Group»  отмечаем 
галочкой  единственную  позицию  «Enabled»,  с 
остальных  позиций  галочки  убираем,  после 
чего нажимаем на кнопку «OK». 
6.
 
Запуск анализа данных
Возвращаемся  на    вкладку  «Advanced»  и 
нажимаем  на  кнопку  «G1»,  которая  запускает 
анализ  распределения  и  вывод  показателей 
описательной  статистики  для  переменных 
«BMI»  и  «Cholesterol»  по-отдельности  для 
мужчин и женщин. 
Если все действия были выполнены, верно, 
то программа представит результаты, которые 
можно  просматривать,  переключаясь  между 
окнами с помощью дерева каталогов (рисунок 
1).  Например,  наведение  курсора  на  раздел 
«Summary:  BMI»  в  каталоге  «Gender=2» 
откроет  окно  вывода  результатов  для 
переменной «BMI» в группе женщин. 
 

Research methodology 
Science & Healthcare, 2, 2016
 
14 
 
 
 
Рис. 1. Дерево каталогов программы Statistica 10. 
 
В  результате  программа  представила 
четыре  окна  вывода  результатов  анализа, 
которые представлены на рисунках 2, 3, 4 и 5. 
Согласно  представленным  результатам,  в 
пользу  нормального  распределения  перемен-
ной «BMI» как в группе мужчин, так и в группе 
женщин свидетельствуют следующие факты: 
 
Гистограмма 
распределения 
переменной «BMI» близка к колоколообразной 
(в  группе  мужчин  и  группе  женщин  по-
отдельности). 
 
На  квантильной  диаграмме  точки 
группируются  по  прямой  (в  группе  мужчин  и 
группе женщин по-отдельности). 
 
Среднее  арифметическое  значение  и 
медиана  имеют  близкие  значения  (в  группе 
мужчин и группе женщин по-отдельности). 
 
Статистическая  значимость  критерия 
Колмогорова-Смирнова  превышает  значение 
0,05  (в  группе  мужчин  и  группе  женщин  по-
отдельности). 
 
Статистическая  значимость  критерия 
Шапиро-Уилка  превышает  значение  0,05  (в 
группе мужчин). 
 
Значения  асимметрии  не  превышает 
1,0  (в  группе  мужчин  и  группе  женщин  по-
отдельности). 
 
Значение  эксцесса  не  превышает  1,0 
(в группе женщин). 
В 
пользу 
отличия 
имеющегося 
распределения 
от 
нормального 
свидетельствуют  статистическая  значимость 
критерия  Шапиро-Уилка  в  группе  женщин, 
имеющая  значение  меньше  0,05,  и  значение 
эксцесса  в  группе  мужчин,  превышающее 
значение  1,0.  Тем  не  менее,  совокупная 
оценка  всех  результатов  проверки  на 
«нормальность» все же склоняет чашу весов в 
пользу 
соответствия 
фактического 
распределения 
переменной 
«BMI» 
нормальному  как  в  группе  мужчин,  так  и  в 
группе женщин. 
В  отношении  переменной  «Cholesterol» 
форма 
гистограммы, 
имеющая 
правостороннюю  асимметрию,  квантильная 
диаграмма, 
статистическая 
значимость 
критериев  Колмогорова-Смирнова  и  Шапиро-
Уилка  и  значения  асимметрии  и  эксцесса 
создают  достаточно  оснований  считать 
распределение  переменной  «Cholesterol» 
отличным от нормального. 
Таким образом, на первом этапе обработки 
данных  установлено,  что  для  сравнения 
группы мужчин с группой женщин по значению 
ИМТ 
необходимо 
использовать 
параметрические  критерии,  а  для  сравнения 
группы  мужчин  с  группой  женщин  по  уровню 
холестерина  крови  –  непараметрические 
критерии. 
Задачей  второго  этапа  исследования 
является  ответ  на  вопрос  –  отличается  ли 
ИМТ мужчин от ИМТ женщин и отличается ли 
уровень  холестерина  крови  у  мужчин  от 
уровня холестерина крови у женщин. 
 

Наука и Здравоохранение, 2, 2016 
Методология научных исследований
 
15 
 
 
 
Рис. 2. Результаты анализа переменной «BMI» (в группе мужчин) в программе Statistica 10. 
 
 
Рис. 3. Результаты анализа переменной «BMI» (в группе женщин) в программе Statistica 10. 
 

Research methodology 
Science & Healthcare, 2, 2016
 
16 
 
 
Рис. 4. Результаты анализа переменной «Cholesterol» (в группе мужчин) 
в программе Statistica 10. 
 
Рис. 5. Результаты анализа переменной «Cholesterol» (в группе женщин) 
в программе Statistica 10. 
 

Наука и Здравоохранение, 2, 2016 
Методология научных исследований
 
17 
 
 
Так  как  на  первом  этапе 
обработки  данных  мы  установили, 
что 
распределение 
ИМТ 
в 
сравниваемых 
группах 
имеет 
нормальное  распределение,  то  в 
данном 
случае 
правомерно 
использовать критерий Стьюдента. 
Для этого снова выбираем меню 
«Statistics»  и  входим  в  раздел 
«Basic 
Statistics/Tables», 
в 
появившемся 
окне 
выбираем 
раздел  «t-test,  independent,  by 
groups»,  и  подтверждаем  выбор 
нажатием на кнопку «ОК» (рисунок 
6).  
В  появившемся  окне  нажимаем 
на  кнопку  «Variables»  и  выбираем 
переменную  «BMI»  как  зависимую, 
а  переменную  «Gender»  –  как 
группирующую  (как  показано  на 
рисунке 7), и подтверждаем выбор 
нажатием на «ОК». 
 
 
Рис. 6. Окно «Basic Statistics and Tables» 
программы Statistica 10. 
 
 
 
Рис. 7. Окно «Select the dependent variables and one grouping variable». 
 
Программа  вернется  к  окну  «T-Test  for 
Independent  Samples  by  Groups»,  в  котором 
нажмем  на  вкладку  «Options»,  где  отметим 
галочками  позиции  «Levene’s  test»  и  «Test  w/ 
separate  variance  estimates»  (рисунок  8). 
Первая позиция нужна для проведения оценки 
равенства  дисперсий  с  помощью  критерия 
Levene,  а  вторая  позиция  позволит  вывести 
результаты расчета коэффициента Стьюдента 
для  случая,  когда  дисперсии  в  сравниваемых 
группах не равны. 
Нажатие  на  кнопку  «Summary»  запускает 
анализ. 

Research methodology 
Science & Healthcare, 2, 2016
 
18 
 
 
Рис. 8. Вкладка «Options» окна «T-Test for Independent Samples by Groups»  
программы Statistica 10. 
 
Результаты анализа данных представлены 
на  рисунке  9.  Проведем  последовательное 
рассмотрение  представленного  длинного 
перечня табличных данных.  
 
 
 
Рис. 9. Результаты расчета критерия Стьюдента в программе Statistica 10. 
 
В  первых  двух  графах  представлены 
среднее  арифметическое  значение  ИМТ 
женщин  –  29,9  кг/м
2
  («Mean  2»),  и  мужчин  – 
28,3  кг/м
2
  («Mean  2»).  Стандартные 
отклонения  представлены  в  соответствующих 
графах «Std. Dev. 2» и «Std. Dev. 1». 
Для интерпретации результатов анализа, в 
первую  очередь  проверяем  требование 
равенства дисперсий: уровень статистической 
значимости  критерия  Levene  (графа  «p 
Levene») 
составил 
0,032, 
что 
ниже 
критического  значения,  равного  0,05.  Таким 
образом, требование равенства  дисперсий  не 
соблюдено,  и  поэтому  следует  учитывать 
результаты  расчета  критерия  Стьюдента, 
приведенные  в  графах  «t  separ.  var.  est.»  – 
«df»  –  «p  2-sided».  Согласно  этим  графам, 
рассчитанный 
уровень 
статистической 
значимости для критерия Стьюдента составил 
0,018  (p = 0,018),  что  меньше  критического 
уровня, равного 0,05. 
Следует  отметить,  что  если  бы  дисперсии 
оказались  равны  (значение  в  графе  «p 
Levene»  превышало  бы  0,05),  то  результаты 
нужно было бы учитывать по графам «t value» 
–  «df»  –  «p».  В  целом,  равенство  дисперсий 
параметра 
в 
сравниваемых 
выборках 
наблюдается  нечасто,  и,  к  сожалению, 
проверяется  исследователями  еще  реже.  В 
данном 
случае 
отсутствие 
равенства 
дисперсий  может  быть  в  некоторой  степени 
объяснено различием количества наблюдений 
в выборках (n = 230 в группе женщин, и n = 68 
в группе мужчин). 
Результаты  проведенных  расчетов  можно 
представить  следующим  образом:  ИМТ 
женщин в среднем превышала ИМТ мужчин на 
1,6 кг/м
2
 (t = 2,402, df =129, p = 0,018). 
Далее  сравним  значения  уровня  холесте-
рина  крови  у  мужчин  с  уровнем  холестерина 
крови у женщин. Как было установлено ранее, 
распределение  переменной  «Cholesterol» 
отличается  от  нормального,  поэтому  будет 
использован  критерий  Манна-Уитни  –  метод 
непараметрической статистики. 
Для  этого  откроем  меню  «Statistics»  и 
выберем 
раздел 
«Nonparametrics». 
В 
открывшемся 
окне 
выберем 
раздел 
«Comparing  independent  samples  (groups)»  и 
подтвердим выбор нажатием на «ОК».  
 

Наука и Здравоохранение, 2, 2016 
Методология научных исследований
 
19 
 
 
Рис. 10. Окно «Nonparametric Statistics» программы Statistica 10. 
 
В  открывшемся  окне  «Comparing  Two 
Groups»  нажимаем  на  кнопку  «Variables»  и 
выбираем 
анализируемые 
переменные 
(«Cholesterol» и «Gender») по аналогии с тем, 
как это сделано на рисунке 7, и кнопкой «ОК» 
подтверждаем  выбор.  Программа  вернется  к 
окну  «Comparing  Two  Groups»,  в  котором  для 
запуска  анализа  нажимаем  на  кнопку  «Mann-
Whitney U test» (рисунок 11). 
 
 

Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   ...   26




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет