Рис. 11. Окно «Comparing Two Groups» программы Statistica 10.
Рис. 12. Результаты расчета критерия Манна-Уитни в программе Statistica 10.
Research methodology
Science & Healthcare, 2, 2016
20
В данном случае мы сравниваем 2
имеющиеся группы, поэтому программа
проставляет коды групп самостоятельно в
окна «Codes for:» для «Group 1» и «Group 2»
(их можно самостоятельно изменить или
назначить две сравниваемые группы из
нескольких, если у группирующей переменной
имеется более 2-х значений).
Результаты анализа представлены на
рисунке 12. Самой важной является графа
«p-value», которая представляет уровень
статистической значимости критерия Манна-
Уитни. Мы видим, что достигнутый уровень
значимости составляет 0,238, что значительно
превышает критической уровень, равный 0,05.
Таким образом, результаты расчетов можно
представить следующим образом: уровень
холестерина крови у мужчин (Me = 4,92)
статистически не отличался от уровня
холестерина крови у женщин (Me = 4,78),
U = 7084, Z = -1,2, p = 0,238 (значения медиан
были рассчитаны ранее и представлены на
рисунках 4 и 5).
Если из любопытства рассчитать значение
критерия Манна-Уитни для переменной «BMI»,
имеющей
близкое
к
нормальному
распределение,
то
получим
уровень
статистической значимости, равный 0,039, в то
время как в результате расчета критерия
Стьюдента
его
значение
оказалось
значительно меньше – 0,018. Данный факт
наглядно подтверждает то, что при наличии
нормального распределения сравниваемых
данных непараметрические статистические
методы имеют меньшую мощность, чем
параметрические.
Сравнение 2-х независимых групп с
использованием программы SPSS 20.
В программе SPSS будут выполнены те же
два этапа анализа – проверка распределения
данных на «нормальность» и сравнение
группы мужчин с группой женщин.
Для начала работы необходимо открыть
файл 2_BMI_chol_SPSS.sav, который следует
загрузить с сайта журнала «Наука и
Здравоохранение». В файле представлены те
же вариационные ряды, что и в файле данных
программы Statistica: пол пациента («Gender»),
ИМТ («BMI») и уровень холестерина
(«Cholesterol») крови.
Краткое описание действий, направленных
на проверку распределения данных:
1.
Вход
в
раздел
описательной
статистики.
Выбираем меню «Analyze» и входим в
раздел «Descriptive Statistics», подраздел
«Explore».
2.
Выбор вариационных рядов для
анализа.
В окне «Explore» переносим из левого поля
в поле «Dependent List» переменные «BMI» и
«Cholesterol», а в поле «Factor List»
переменную
«Gender»
(перенос
осуществляется путем выделения нужной
переменной и нажатием на стрелку между
полями).
3.
Настройка
вывода
параметров
описательной статистики.
В окне «Explore» нажимаем на кнопку
«Statistics» и отмечаем галочками позиции
«Descriptives» и «Percentiles», после чего
нажимаем на кнопку «Continue».
4.
Настройка расчета статистических
критериев для проверки распределения на
«нормальность», гистограмм распределения и
квантильных диаграмм.
В окне «Explore» нажимаем на кнопку
«Plots» и отмечаем галочками позиции
«Histogram» и «Normality plots with tests»,
после чего нажимаем на кнопку «Continue».
5.
Запуск анализа данных.
В окне «Explore» нажимаем на кнопку «OK».
Программа
представит
параметры
описательной
статистики
(таблицы
«Descriptives» и «Percentiles» не приводится
из-за большого размера), результаты расчетов
критерия Шапиро-Уилка и Колмогорова-
Смирнова с поправкой Lilliefors (таблица 3) и
графики – гистограммы распределения и
квантильные диаграммы (рисунки 13 и 14).
Все представленные программой SPSS
результаты соответствуют тем, что были
приведены выше в результатах анализа
данных программы Statistica, и не требуют
дополнительных комментариев.
Наука и Здравоохранение, 2, 2016
Методология научных исследований
21
Таблица 3.
Результаты проверки распределения переменных «BMI» и «Cholesterol» с помощью
статистических критериев
Gender
Kolmogorov-Smirnov
a
Shapiro-Wilk
Statistic
df
Sig.
Statistic
df
Sig.
BMI
male
,066
68
,200
*
,965
68
,051
female
,052
230
,200
*
,985
230
,015
Cholesterol
male
,158
68
,000
,881
68
,000
female
,134
230
,000
,870
230
,000
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
Гистограмма распределения переменной
«BMI» (мужчины)
Квантильная диаграмма переменной
«BMI» (мужчины)
Гистограмма распределения переменной
«BMI» (женщины)
Квантильная диаграмма переменной
«BMI» (женщины)
Рис. 13. Гистограммы распределения и квантильные диаграммы
для переменной «BMI» в программе SPSS.
Research methodology
Science & Healthcare, 2, 2016
22
Гистограмма распределения переменной
«Cholesterol» (мужчины)
Квантильная диаграмма переменной
«Cholesterol» (мужчины)
Гистограмма распределения переменной
«Cholesterol» (женщины)
Квантильная диаграмма переменной
«Cholesterol» (женщины)
Рис. 14. Гистограммы распределения и квантильные диаграммы для переменной
«Cholsterol» в программе SPSS.
Далее проведем сравнение ИМТ в группе
мужчин с ИМТ в группе женщин. Для этого
снова войдем в меню «Analyze» и выберем
раздел
«Compare
Means»,
подраздел
«Independent-Samples T Test» (рисунок 15).
Рис. 15. Выбор раздела «Independent-Samples T Test» меню «Analyze» программы SPSS 20.
Наука и Здравоохранение, 2, 2016
Методология научных исследований
23
В открывшемся окне «Independent-Samples
T Test» перенесем переменную «BMI» в поле
анализируемых переменных «Test variable(s)»,
а переменную «Gender» – в поле группирующей
переменной «Grouping variable» (рисунок 16).
Для начала анализа требуется установить
определенные
значения
группирующей
переменной: для этого нужно выделить слово
«Gender» в поле «Grouping Variable», затем
нажать на кнопку «Define Groups», после чего
появится окно «Define Groups», в котором
установим для первой и второй группы
значения «1» и «2» соответственно (рисунок
17). Выбор подтверждаем нажатием на кнопку
«Continue». Запуск анализа производится
нажатием на кнопку «OK».
Рис. 16. Окно «Independent-Samples T Test» программы SPSS 20.
Рис. 17. Окно «Define Groups» программы SPSS 20.
Результаты анализа представлены в
таблице 4. В двух графах «Levene's Test for
Equality
of
Variances»
программа
представляет результаты расчета критерия
Levene для оценки равенства дисперсий («F»)
и уровень статистической значимости
(«Sig.»). Так как уровень статистической
значимости для критерия Levene (0,032)
меньше
критического
значения
0,05,
результаты смотрим во второй строке
таблицы «Equal variances not assumed».
Значение критерия Стьюдента (графа «t»)
составило -2,402, количество степеней
свободы («df») – 129, уровень статистической
значимости («Sig. (2-tailed)») – 0,018.
Результаты
расчетов
полностью
соответствуют представленным на рисунке
12, за исключением того, что в программе
Statistica 10 значение t равно 2,402, а не -
2,402, но это не важно, так как значения t в t-
распределении расположены симметрично
относительно нуля.
Если бы дисперсии оказались равными,
результаты следовало бы смотреть по первой
строке таблицы («Equal variances assumed»).
Значение -1,68 в графе «Mean Difference»
показывает, что ИМТ мужчин в среднем был
на 1,68 кг/м
2
ниже ИМТ женщин.
Research methodology
Science & Healthcare, 2, 2016
24
Таблица 4.
Результаты анализа переменной «BMI» с помощью критерия Стьюдента.
Levene's Test
for Equality of
Variances
t-test for Equality of Means
F
Sig.
t
df
Sig.
(2-
tailed)
Mean
Difference
Std. Error
Difference
95% Confidence
Interval of the
Difference
Lower Upper
BMI
Equal
variances
assumed
4,638
,032 -2,175
296 ,030 -1,68388
,77429 -3,20769
-
,16007
Equal
variances
not assumed
-2,402 129,553 ,018 -1,68388
,70092 -3,07061
-
,29715
Далее выполним расчет критерия Манна-
Уитни
для
переменной
«Cholesterol»,
имеющей распределение, отличное от
нормального.
Для этого снова войдем в меню «Analyze»,
выберем раздел «Nonparametric Tests»,
подраздел «Legacy Dialogs», в котором
выберем позицию «2 Independent Samples»,
как показано на рисунке 18.
Рис. 18. Выбор раздела «2 Independent Samples» меню «Analyze» программы SPSS 20.
Наука и Здравоохранение, 2, 2016
Методология научных исследований
25
В открывшемся окне «Two-Independent-
Samples Tests» оставим отмеченной позицию
«Mann-Whitney U», перенесем переменную
«Cholestrol» в поле «Test Variable List», а
переменную «Gender» – в поле «Grouping
Variable» (рисунок 19), после чего потребуется
нажать на слово «Gender» и выбрать значения
группирующей переменной так, как показано
на рисунке 17.
Рис. 19. Окно «Two-Independent-Samples
Tests» программы SPSS 20.
Запуск анализа производится нажатием на
кнопку
«OK».
Результаты
анализа
представлены в таблице 5.
Таблица 5.
Результаты анализа переменной
«Cholesterol» с помощью критерия
Манна-Уитни
Cholesterol
Mann-Whitney U
7083,500
Wilcoxon W
33648,500
Z
-1,180
Asymp. Sig. (2-tailed)
,238
a. Grouping Variable: Gender
Для представления результатов анализа
потребуются значения по строкам «Mann-
Whitney U», «Z» и «Asymp. Sig. (2-tailed)»
(значение p). Результаты расчета полностью
соответствуют тем, которые были получены с
помощью программы Statistica и представлены
на рисунке 12, и не требуют дополнительных
комментариев.
В следующей статье будет представлен
алгоритм обработки количественных данных
двух парных выборок с использованием
программ Statistica 10 и SPSS 20.
Литература:
1.
Аканов
А.А.,
Турдалиева
Б.С.,
Изекенова А.К., Рамазанова М.А., Абдраимова
Э.Т., Гржибовский А.М. Оценка использования
статистических методов в научных статьях
медицинских журналов Казахстана // Экология
человека. 2013. №5. С. 61-64.
2.
Боровиков В. STATISTICA. Искусство
анализа данных на компьютере: для
профессионалов. СПб. : Питер, 2003. 688 с.
3.
Бююль А., Цефель П. SPSS: искусство
обработки
информации.
Анализ
статистических данных и восстановление
скрытых закономерностей. СПб. : ООО
«ДиаСофтЮП», 2005. 608 с.
4.
Гланц
С.
Медико-биологическая
статистика. М. : Практика, 1998. 459 с.
5.
Гржибовский
А.М.
Анализ
количественных
данных
для
двух
независимых групп // Экология человека. 2008.
№2. С. 54-61.
6.
Гржибовский А.М. Доверительные
интервалы для частот и долей // Экология
человека. 2008. №5. С. 57-60.
7.
Гржибовский А.М. Типы данных,
проверка распределения и описательная
статистика // Экология человека. 2008. №1. С.
52-58.
8.
Гржибовский А.М., Иванов С.В.
Горбатова М.А. Исследования типа «случай-
контроль» в здравоохранении // Наука и
Здравоохранение. 2015. № 4. С. 5-17
9.
Гржибовский А.М., Иванов С.В.
Когортные исследования в здравоохранении //
Наука и Здравоохранение. 2015. № 3. С. 5-16.
10.
Гржибовский А.М., Иванов С.В.
Поперечные (одномоментные) исследования в
здравоохранении // Наука и Здравоохранение.
2015. № 2. С. 5-18.
11.
Гржибовский А.М., Иванов С.В.,
Горбатова М.А. Описательная статистика с
использованием
пакетов
статистических
программ Statistica и SPSS // Наука и
Здравоохранение. 2015. № 1. С. 7-23.
12.
Гржибовский А.М., Иванов С.В.,
Горбатова
М.А.
Экологические
(корреляционные)
исследования
в
здравоохранении // Наука и Здравоохранение.
2015. № 5. С. 5-18.
13.
Гржибовский А.М., Иванов С.В.,
Горбатова
М.А.
Экспериментальные
Research methodology
Science & Healthcare, 2, 2016
26
исследования в здравоохранении // Наука и
Здравоохранение. 2015. № 6. С. 5-17.
14.
Жунисова М.Б., Шалхарова Ж.С.,
Шалхарова Ж.Н., Гржибовский А.М. Типы
пищевого поведения и абдоминальное
ожирение // Медицина. 2015. №4. С. 92-95.
15.
Жунисова М.Б., Шалхарова Ж.С.,
Шалхарова Ж.Н., Нускабаева Г.О., Садыкова
К.Ж., Маденбай К.М., Гржибовский А.М.
Психоэмоциональный стресс как предиктор
типа пищевого поведения в Казахстане //
Экология человека. 2015. №5. С. 36-45.
16.
Зуева
Л.П.,
Яфаев
Р.Х.
Эпидемиология: учебник. СПб : ООО
«Издательство Фолиант», 2008. 752 с.
17.
Лакин Г.Ф. Биометрия. М. : Высшая
школа, 1990. 351 с.
18.
Маденбай К.М., Шалхарова Ж.С.,
Шалхарова Ж.Н., Жунисова М.Б., Садыкова
К.Ж., Нускабаева Г.О., Гржибовский А.М.
Оценка связи между площадью подкожной
жировой
ткани
и
показателями
электронейромиографии // Экология человека.
2015. №7. С. 58-64.
19.
Петри А., Сэбин К. Наглядная
статистика в медицине. М. : ГЭОТАР-Мед,
2003. 140 с.
20.
Рахыпбеков Т.К., Гржибовский А.М. К
вопросу о необходимости повышения качества
казахстанских научных публикаций для
успешной интеграции в международное
научное
сообщество
//
Наука
и
Здравоохранение. 2015. №1. С. 5-11.
21.
Реброва О.Ю. Статистический анализ
медицинских данных. Применение пакета
прикладных программ STATISTICA. М. :
МедиаСфера, 2002. 312 с.
22.
Садыкова К.Ж., Шалхарова Ж.С.,
Нускабаева Г.О., Садыкова А.Д., Жунисова
М.Б., Маденбай К.М., Гржибовский А.М.
Распространенность анемии, ее социально-
демографические детерминанты и возможная
связь с метаболическим синдромом в г.
Туркестан, Южный Казахстан // Экология
человека. 2015. №8. С. 58-64.
23.
Статистический анализ эмпирических
исследований
[электронный
ресурс].
URL: www.statexpert.org/articles/таблицы_крити
ческих_значений_статистических_критериев
(дата обращения 02.08.2015).
24.
Субботина А.В., Гржибовский А.М.
Описательная
статистика
и
проверка
нормальности распределения количественных
данных // Экология человека. 2014. №2. С. 51-
57.
25.
Флетчер
Р.
Клиническая
эпидемиология.
Основы
доказательной
медицины: пер. с англ. / Р. Флетчер, С. Флетчер,
Э. Вагнер. М. : Медиа Сфера, 1998. 352 с.
26.
Харькова О.А., Гржибовский А.М.
Сравнение одной и двух несвязанных выборок
с помощью пакета статистических программ
STATA: непараметрические критерии //
Экология человека. 2014. №4. С. 60-64.
27.
Харькова О.А., Гржибовский А.М.
Сравнение одной и двух несвязанных выборок
с помощью пакета статистических программ
STATA: параметрические критерии // Экология
человека. 2014. №3. С. 57-61.
28.
Юнкеров
В.И.,
Григорьев
С.Г.
Математико-статистическая обработка данных
медицинских исследований. СПб : ВМедА,
2002. 266 с.
29.
Beaglehole R., Bonita R. Basic
epidemiology. World Health Organization,
Geneva, 1993.
30.
Cleopas T.J. et al. Statistics Applied to
Clinical Trials. 4th ed. Springer, 2009.
31.
Gorbatova
M.A.,
Gorbatova
L.N.,
Grjibovski A.M. Dental caries experience among
15-year-old adolescents in north-west Russia // Int.
J. Circumpolar Health. 2011. Vol. 3. P. 232-235.
32.
Gorbatova M.A., Gorbatova L.N., Pastbin
M.U., Grjibovski A.M. Urban-rural differences in
dental caries experience among 6-year-old
children in the Russian north // Rural Remote
Health. 2012. Vol. 12. P. 1999.
33.
Gorbatova M.A., Grjibovski A.M.,
Gorbatova L.N., Honkala E. Dental caries
experience among 12-year-old children in
Northwest Russia // Community Dent. Health.
2012. Vol. 1. P. 20-24.
References:
1.
Akanov A.A., Turdalieva B.S., Izekenova
A.K., Ramazanova M.A., Abdraimova, Grjibovski
A.M. Otsenka ispolzovania statisticheskih
metodov v nauchnih statyakh Kazakhstana
[Assesment of use of statistical methods in
scientific articles of the Kazakhstan’s medical
Наука и Здравоохранение, 2, 2016
Методология научных исследований
27
journals]. Ekologiya cheloveka [Human Ecology].
2013. No.5. PP. 61-64. [in Russian]
2.
Borovikov V. STATISTICA. Iskusstvo
analiza
dannikh
na
kompyutere:
dlya
professionalov [STATISTICA. The art of data
analysis using computer: for professionals]. SPb.:
Piter, 2003. P. 688.
3.
Buhl A., Zofel P. SPSS: isskustvo
obrabotki informatsii. Analiz statisticheskih
daanikh
i
vosstanovlenie
skritikh
zakonomernostey [SPSS: the art of information
analysis. Statistical data analysis and hidden
regularities
identification].
SPb.:
OOO
«DiaSoftUP», 2005. P. 608. [in Russian]
4.
Glants
S.
Mediko-biologicheskaya
statistika [The biomedical statistics]. M. : Praktika,
1998. PP. 459. [in Russian]
5.
Grjibovski A.M. Analiz kolichestvennikh
dannikh dlya dvuh nezavisimih grupp [Analysis of
quantitative data of two independent samples].
Ekologiya cheloveka [Human Ecology]. 2008.
No.2. PP. 54-61. [in Russian]
6.
Grjibovski A.M. Doveritel'ny eintervaly
dlya chastot i dolei [Confidence intervals for
proportions]. Ekologiya cheloveka [Human
Ecology]. 2008. No.5. PP. 57-60. [in Russian]
7.
Grjibovski A.M. Tipy dannikh, proverka
raspredeleniya I opisatelnaya statistika [Types of
data, distribution estimation and descriptive
statistics]. Ekologiya cheloveka [Human Ecology].
2008. No.1. PP. 52-58. [in Russian].
8.
Grjibovski A.M., Ivanov S.V., Горбатова
М.А. Gorbatova M.A.Issledovaniya tipa sluchay-
kontrol v zdravoohranenii [Case-control studies in
health sciences]. Nauka i Zdravoohranenie
[Science & Healthcare]. 2015, 4, рр. 5-17 [in
Kazakhstan].
9.
Grjibovski A.M., Ivanov S.V. Kogortnie
issledovaniya v zdravoohranenii [Cohort studies
in health sciences]. Nauka i Zdravoohranenie
[Science & Healthcare]. 2015, 3, pp. 5-16. [in
Kazakhstan]
10.
Grjibovski A.M., Ivanov S.V. Poperechnie
(odnomomentnie)
issledovanoya
v
zdravoohranenii [Cross-sectional studies in health
sciences]. Nauka i Zdravoohranenie [Science &
Healthcare]. 2015, 2, PP. 5-18. [in Kazakhstan]
11.
Grjibovski A.M., Ivanov S.V., Gorbatova
M.A. Opisatel'naya statistika s ispol'zovaniem
paketov statisticheskikh programm Statistica i
SPSS [Descriptive statistics using Statistica and
SPSS software]. Nauka i Zdravoohranenie
[Science & Healthcare]. 2016, 1, рр. 7-23 [in
Kazakhstan].
12.
Grjibovski A.M., Ivanov S.V., Gorbatova
M.A.
Ekologicheskiye
(korrelyatsionnye)
issledovaniya v zdravoohranenii [Ecological
(correlational) studies in health sciences]. Nauka i
Zdravoohranenie [Science & Healthcare]. 2015,
5, рр. 5-18. [in Kazakhstan].
13.
Grjibovski
A.M.,
Ivanov
S.V.
Eksperimentalnie
issledovaniya
v
zdravookhranenii [Experimental studies in health
sciences]. Nauka i Zdravoohranenie [Science &
Healthcare]. 2015, 6, рр. 5-17 [in Kazakhstan].
14.
Zhunissova M.B., Shalkarova Zh.S.,
Shalkarova Zh. N., Nuskabayeva G.O., Sadykova
K. Zh., Madenbay K.M., Grjibovski A.M. Tipy
pischevogo povedeniya i abdominalnoe ozhirenie
[Eating behavior types and abdominal obesity].
Meditsina [Medicine]. 2015, 4. PP. 92-95.
15.
Zhunissova M.B., Shalkarova Zh.S.,
Shalkarova Zh. N., Nuskabayeva G.O., Sadykova
K. Zh., Madenbay K.M., Grjibovski A.M.
Psykhoemotsionalniy stress kak predictor tipa
pischevogo
povedeniya
v
Kazakhstane
[Psychoemotional stress and eating behavior in
Kazakhstan]. Ekologiya cheloveka [Human
Ecology]. 2015. No.5. PP. 36-45. [in Russian]
16.
Zueva L.P, Yafaev R.H. Epidemiologiya:
uchebnik [Epidemiology: the textbook]. SPb :
OOO «Izdatelstvo Foliant», 2008. P. 752. [in
Russian].
17.
Lakin G.F. Biometria [Biometrics]. M. :
Viscshaya shkola. 1990. P. 351. [in Russian]
18.
Madenbay K.M., Shalkarova Zh.S.,
Shalkarova Zh. N., Zhunissova M.B., Sadykova
K. Zh., Nuskabayeva G.O., Grjibovski A.M.
Otsenka svyazi mezhdu ploshadyu podkojnoy
jirovoy tkani I pokazatelyami electroneyromiografii
[Assesment of the relationship between
subcutaneous fat tissue an results of
electromyoneurography]. Ekologiya cheloveka
[Human Ecology]. 2015. No.7. PP. 58-64. [in
Russian]
19.
Petri A., Sebin K. Naglyadnaya statistika
v meditsine [Demonstrative statistics in medicine].
M. : GEAOTAR-Med, 2003. p. 140. [in Russian]
20.
Rakhypbekov T.K., Grjibovski A.M. K
voprosu o nedhodimosti povisheniya kachestva
kazakhstanskih
nauchih
publicatsiy
dlya
uspeshnoy integratsii v mezhdunarodnoe
|