An introduction to educational research methods. Введение в образовательные исследовательские методы Білім беру-зерттеу әдістеріне кіріспе


Анализ данных – статистика вывода



Pdf көрінісі
бет60/85
Дата06.03.2017
өлшемі32,4 Mb.
#8078
1   ...   56   57   58   59   60   61   62   63   ...   85

Анализ данных – статистика вывода  

 

 

Изучив  данные  и  получив  представление  о  взаимосвязях  между  различными  переменными,  можно 



переходить  к  сути  дела  и  ответить  на  исходные  вопросы  исследования.  Меня  интересовала 

взаимосвязь между мотивацией и уровнем когнитивного развития. Я спрогнозировала, что студенты, 

набравшие  высокий  балл  по  шкале  мотивации  задачи (стремление  изучать  и  осваивать  новое),  в 

целом  наберут  более  высокие  баллы  в  тесте  на  когнитивное  развитие,  чем  ученики  с  низкими 

баллами по шкале мотивации задачи. Также я ожидала, что ученики с высокими баллами по шкале 

отчуждения (активное противостояние обучению) в целом будут иметь более низкие баллы по шкале 

когнитивного развития, чем студенты с низкими баллами по шкале отчуждения. Я также полагал, что 

девочки наберут более высокие баллы по шкале мотивации задачи и более низкие баллы по шкале 

отчуждения, чем мальчики, и что уровень когнитивного развития девочек будет выше.  

  Чтобы  оценить  верность  моих  гипотез,  нам  необходимо  провести  ряд  статистических  тестов.  По 

сути, 

я 

задаю 



два 

разных 


типа 

вопроса: 



Ур

ов

ен

ь 

ко

гн

ит

ив

но

го

 р

аз

ви

ти

я 

Мотивация задачи (наука) 

Analysing Quantitative Data

519


Анализ данных – статистика вывода 

Изучив данные и получив представление о взаимосвязях между различными 

переменными, можно переходить к сути дела и ответить на исходные вопросы 

исследования. Меня интересовала взаимосвязь между мотивацией и уровнем 

когнитивного развития. Я спрогнозировала, что студенты, набравшие высокий балл по 

шкале мотивации задачи (стремление изучать и осваивать новое), в целом наберут 

более высокие баллы в тесте на когнитивное развитие, чем ученики с низкими 

баллами по шкале мотивации задачи. Также я ожидала, что ученики с высокими 

баллами по шкале отчуждения (активное противостояние обучению) в целом будут 

иметь более низкие баллы по шкале когнитивного развития, чем студенты с низкими 

баллами по шкале отчуждения. Я также полагал, что девочки наберут более высокие 

баллы по шкале мотивации задачи и более низкие баллы по шкале отчуждения, чем 

мальчики, и что уровень когнитивного развития девочек будет выше. 

 

Чтобы оценить верность моих гипотез, нам необходимо провести ряд 



статистических тестов. По сути, я задаю два разных типа вопроса:

1. Существует ли связь между двумя переменными (например, между мотивацией 

задачи и уровнем когнитивного развития)?

2. Есть ли разница между двумя группами по определенной переменной (напр., между 

мальчиками и девочками по мотивации задачи)?

 

Каждый тип вопроса требует определенного статистического теста, которые 



описаны далее. 

1. Критерии корреляции 

Первый тип вопроса относится к взаимосвязям или корреляциям между 

переменными, и потому подходящим статистическим критерием в этом случае 

будет критерий корреляции. В основе данного типа критерия лежит рассмотрение 

фактической обнаруженной взаимосвязи (так что нам необходимо рассчитать 

конкретный элемент для ее оценки), после чего необходимо решить, насколько 

вероятен был бы этот результат, если на самом деле связь между интересующими 

переменными отсутствовала. По сути, мы оцениваем вероятность того, что 

полученные результаты ложны, т.е. в действительности мотивация и когнитивное 

развитие никак не связаны; что некая взаимосвязь прослеживается в этих школах 

случайно. Нам необходимо использовать этот метод, поскольку мы просто не 

знаем, существует ли такая связь в действительности или нет, и мы должны вынести 

как можно лучшее суждение на основании имеющихся данных и взвешивая все 

факторы. Эти факторы (или вероятности) можно вычислить лишь исходя из 

того, что переменные не связаны. Если мы ищем взаимосвязи между группами, 

то нам необходимо двигаться из немного другой исходной позиции, описанной 

ниже. Однако вычисления, проводимые в любом статистическом тесте, включают 


Analysing Quantitative Data

520


вычисление вероятностей, чтобы позволить провести тест и принять спорное 

решение. Поэтому результаты вычислений называются статистикой вывода, а сами 

тесты часто называют проверкой значимости. 

 

Элемент, вычисленный в ходе теста на корреляцию для вычисления 



взаимосвязи между двумя интересующими переменными, является коэффициентом 

корреляции. Статистический тест позволяет мне оценить значимость (т.е. по 

принципу большей вероятности, существует взаимосвязь между мотивацией 

и когнитивным развитием). На этом этапе у меня было несколько вариантов 

коэффициентов корреляции для вычисления, в зависимости от уровня измерения 

и разброса моих переменных. Если вы намерены использовать статистику вывода, 

то вам необходимо изучить этот предмет более детально, так как в этой главе я 

привожу лишь введение в этот предмет. В частности, вы можете решить провести 

либо параметрический, либо непараметрический тест. Первый, как правило, 

предпочтительнее, поскольку он дает больше возможностей и более чувствителен 

к вашим данным, однако он также делает определенные допущения относительно 

ваших данных. По причинам, на объяснение которых здесь не хватит места, мои 

данные приемлемы для параметрического теста, поэтому мне необходимо вычислить 

соответствующий коэффициент корреляции, коэффициент Пирсона (Pearson), а затем 

просмотреть результаты проверки значимости. В SPSS эта процедура проводится с 

помощью опции «correlate» в меню «analyse». Результаты проверки на корреляцию 

между уровнем когнитивного развития и баллами мотивации задачи (наука) 

представлены в таблице 10.5. 



Таблица 10.5 Проверка значимости корреляции между мотивацией задачи 

(наука) и уровнем когнитивного развития 

Сначала это может показаться немного путанным, поскольку в таблице повторяется 

одна и та же информация. Нас интересует взаимосвязь между уровнем когнитивного 

развития и мотивацией задачи (наука). Если вы посмотрите в соответствующий 

квадрант (верхний правый или нижний левый), то увидите коэффициент корреляции, 

значимый результат и количество учеников, данные которых были учтены при 

вычислении статистики (1428). Коэффициент корреляции -0,043 практически 

равен нулю. Поскольку коэффициенты корреляции варьируются от -1 (крайне 

отрицательная корреляция) до +1 (крайне положительная корреляция), то это 

указывает на отсутствие взаимосвязи между уровнем когнитивного развития и 

мотивацией задачи, что противоречит изначальным гипотезам (но, вероятно, 

неудивительно, учитывая ранее приведенную диаграмму разброса). Значимый 

 

1 Существует ли связь между двумя переменными (например, между мотивацией задачи и уровнем 



когнитивного развития)? 

 

2 Есть ли разница между двумя группами по определенной переменной (напр., между мальчиками и 



девочками по мотивации задачи)? 

   


Каждый тип вопроса требует определенного статистического теста, которые описаны далее.  

 

1. Критерии корреляции  



 

Первый  тип  вопроса  относится  к  взаимосвязям  или  корреляциям  между  переменными,  и  потому 

подходящим статистическим критерием в этом случае будет критерий корреляции. В основе данного 

типа критерия лежит рассмотрение фактической обнаруженной взаимосвязи (так что нам необходимо 

рассчитать конкретный элемент для ее оценки), после чего необходимо решить, насколько вероятен 

был  бы  этот  результат,  если  на  самом  деле  связь  между  интересующими  переменными 

отсутствовала.  По  сути,  мы  оцениваем  вероятность  того,  что  полученные  результаты  ложны,  т.е.  в 

действительности  мотивация  и  когнитивное  развитие  никак  не  связаны;  что  некая  взаимосвязь 

прослеживается  в  этих  школах  случайно.  Нам  необходимо  использовать  этот  метод,  поскольку  мы 

просто не знаем, существует ли такая связь в действительности или нет, и мы должны вынести как 

можно лучшее суждение на основании имеющихся данных и взвешивая все факторы. Эти факторы 

(или вероятности) можно вычислить лишь исходя из того, что переменные не связаны. Если мы ищем 

взаимосвязи  между  группами,  то  нам  необходимо  двигаться  из  немного  другой  исходной  позиции, 

описанной  ниже.  Однако  вычисления,  проводимые  в  любом  статистическом  тесте,  включают 

вычисление  вероятностей,  чтобы  позволить  провести  тест  и  принять  спорное  решение.  Поэтому 

результаты  вычислений  называются  статистикой  вывода,  а  сами  тесты  часто  называют  проверкой 

значимости.  

  Элемент,  вычисленный  в  ходе  теста  на  корреляцию  для  вычисления  взаимосвязи  между  двумя 

интересующими переменными, является коэффициентом корреляции. Статистический тест позволяет 

мне  оценить  значимость (т.е.  по  принципу  большей  вероятности,  существует  взаимосвязь  между 

мотивацией  и  когнитивным  развитием).  На  этом  этапе  у  меня  было  несколько  вариантов 

коэффициентов  корреляции  для  вычисления,  в  зависимости  от  уровня  измерения  и  разброса  моих 

переменных.  Если  вы  намерены  использовать  статистику  вывода,  то  вам  необходимо  изучить  этот 

предмет более детально, так как в этой главе я привожу лишь введение в этот предмет. В частности, 

вы  можете  решить  провести  либо  параметрический,  либо  непараметрический  тест.  Первый,  как 

правило, предпочтительнее, поскольку он дает больше возможностей и более чувствителен к вашим 

данным,  однако  он  также  делает  определенные  допущения  относительно  ваших  данных.  По 

причинам,  на  объяснение  которых  здесь  не  хватит  места,  мои  данные  приемлемы  для 

параметрического  теста,  поэтому  мне  необходимо  вычислить  соответствующий  коэффициент 

корреляции, коэффициент Пирсона (Pearson), а затем просмотреть результаты проверки значимости. 

В  SPSS  эта  процедура  проводится  с  помощью  опции «correlate»  в  меню «analyse».  Результаты 

проверки на корреляцию между уровнем когнитивного развития и баллами мотивации задачи (наука) 

представлены в таблице 10.5.  

 

Таблица 10.5 Проверка значимости корреляции между мотивацией задачи (наука) и уровнем когнитивного развития  

 

 

 



Уровень когнитивного 

развития 

Мотивация задачи (наука) 

Уровень когнитивного 

развития  

Корреляция Пирсона  

−.043  


Sig. (двусторонняя)  

 

104 



N  

1723  


1428  

Мотивация задачи (наука) 

Корреляция Пирсона  

−.043  


Sig. (двусторонняя)  

104 

 

N  



1428  

1428  


 

  Сначала это может показаться немного путанным, поскольку в таблице повторяется одна и та же 

информация.  Нас  интересует  взаимосвязь  между  уровнем  когнитивного  развития  и  мотивацией 

задачи (наука).  Если  вы  посмотрите  в  соответствующий  квадрант (верхний  правый  или  нижний 

левый),  то  увидите  коэффициент  корреляции,  значимый  результат  и  количество  учеников,  данные 

которых  были  учтены  при  вычислении  статистики (1428). Коэффициент  корреляции  -0,043 

практически  равен  нулю.  Поскольку  коэффициенты  корреляции  варьируются  от  -1 (крайне 

отрицательная  корреляция)  до +1 (крайне  положительная  корреляция),  то  это  указывает  на 

отсутствие  взаимосвязи  между  уровнем  когнитивного  развития  и  мотивацией  задачи,  что 

противоречит  изначальным  гипотезам (но,  вероятно,  неудивительно,  учитывая  ранее  приведенную 

диаграмму  разброса).  Значимый  результат  сообщает  вам  вероятность  получения  коэффициента 


Analysing Quantitative Data

521


результат сообщает вам вероятность получения коэффициента корреляции -0,043, 

если бы когнитивное развитие и мотивация задачи не были связаны в реальной жизни 

помимо моего исследования. Поэтому существует вероятность 0,104 (которую 

можно перевести в проценты, умножив на 100, т.е. 10,4%) что мой коэффициент 

корреляции -0,043 мог возникнуть случайно, в отсутствие взаимосвязи между 

этими двумя переменными. Хотя вероятность в 10% может выглядеть достаточно 

низкой для того, кто использует этот метод впервые, в действительности это по-

прежнему достаточно вероятно. Поэтому мы приходим к заключению, что нет 

причин отклоняться от статуса кво, что когнитивное развитие и мотивация задачи не 

связаны. В действительности, применяется практическое правило, согласно которому 

в данном типе теста (двусторонний тест – я снова не могу дать более подробных 

объяснений, но вы можете найти их) вам необходимо получить вероятность менее 

2,5%, прежде чем принимать спорное решение о связи между двумя переменными. И 

даже в этом случае мы не знаем наверняка, так это или нет, поэтому вам никогда не 

следует излагать свои выводы в точных формулировках. 

2. Критерии различия 

Как и в случае критериев корреляции, существуют различные типы критериев 

различия, соответствующие характеристикам имеющихся у вас данных (относительно 

уровня измерения и разброса рассматриваемой переменной). Если мы проведем 

параметрическую проверку различия (поскольку данные подходят для нее, как 

указано в предыдущем разделе), то мы сравним средний балл каждой группы по 

конкретной переменной. Поэтому, например, если мы хотим узнать, различаются ли 

баллы девочек и мальчиков по шкале мотивации задачи, то мы сравним средние баллы 

девочек и мальчиков по этой шкале. Элемент, рассчитанный в процессе сравнения, 

называется t-статистикой, а сам критерий называется критерием Стьюдента. Здесь в 

основе расчетов t-статистики лежит допущение, что между двумя рассматриваемыми 

группами (т.е. мальчиками и девочками) не существует различий.

 

В SPSS t-критерии находятся под опцией «compare means» (сравнение 



средних значений) в меню «analyse». Хотя мы проводим параметрический анализ, 

есть различные способы сравнения средних значений, которые отражены в 

способе выполнения процедуры «compare means». Поскольку мы сравниваем две 

разные группы (мальчиков и девочек) по определенной переменной (мотивация 

задачи), то это критерий независимых выборок. Это противоречит ситуации, когда 

вы можете сравнивать одних людей по двум разным переменным (например, 

в моем исследовании я сравнил баллы учеников по каждой шкале мотивации в 

начале и в конце двухлетнего обучения, чтобы проверить, не изменились ли они), 

что потребовало бы использования анализа повторных измерений. Вам также 

необходимо указать, какие группы вы сравниваете (в «define groups» (задать группы)), 

для чего вам необходимо вставить коды, заданные вами для групп, которые вы хотите 

сравнить (в моем случае 1 и 2, обозначающие мальчиков и девочек соответственно). 

Вам необходимо указывать группы, поскольку есть вероятность, что у вас больше 


Analysing Quantitative Data

522


групп на определенную переменную в базе данных (напр., я могу захотеть сравнить 

баллы мотивации задачи для двух из моих девяти школ).



Таблица 10.6 Критерий значимости для разницы между мальчиками и 

девочками по шкале мотивации задачи (наука) 

В верхней части таблицы представлена описательная статистика, что удобно, 

поскольку мы не нашли заранее средних баллов для мальчиков и девочек по шкале 

мотивации задачи (хотя обычно в таком типе анализа вы начинаете с описательной 

статистики, прежде чем проводить статистические проверки). Как можно было 

ожидать, средние баллы для мальчиков и девочек не одинаковы. В действительности 

мальчики (со средним баллом 25,02) в целом набрали немного более высокие 

баллы, чем девочки (со средним баллом 24,98), чего я не ожидал. Чтобы проверить, 

насколько расходятся эти небольшие различия, нам необходимо взглянуть на 

нижнюю часть таблицы. 

 

Хотя в ней представлено много информации, на данный момент вам следует 



обратить внимание лишь на две цифры: значение t и на значение «sig» (значимость). 

Для каждого есть два варианта, и подходящий для интерпретации вариант зависит 

от характеристики данных (в данном случае насколько велика дисперсия баллов 

девочек по сравнению с мальчиками, что для этих данных является справедливым 

допущением – и снова вам необходимо прочесть больше по данному вопросу). 

Поэтому, делая допущение о равной дисперсии, нам следует обратить внимание 

на верхнем значении в каждом случае. Вычисленное значение t составляет 0,239. В 

отличие от коэффициента корреляции, это само по себе мало говорит вам о разнице 

между баллами девочек и мальчиков, кроме как чем больше это значение, тем больше 

разница между группами. Однако уровень значимости (0,811) говорит нам, насколько 

вероятно, что мы получим значение t, равное 0,239, если разницы между мальчиками 

и девочками нет. Поэтому в этом случае вероятность получения значения t = 0,239, 

если бы между мальчиками и девочками не было разницы, составляет 81,1%, весьма 

велика. На основании того же критерия, что и раньше (т.е. мы должны были бы 

корреляции -0,043, если бы когнитивное развитие и мотивация задачи не были связаны в реальной 

жизни  помимо  моего  исследования.  Поэтому  существует  вероятность 0,104 (которую  можно 

перевести  в  проценты,  умножив  на 100, т.е. 10,4%) что  мой  коэффициент  корреляции  -0,043  мог 

возникнуть случайно, в отсутствие взаимосвязи между этими двумя переменными. Хотя вероятность 

в 10% может  выглядеть  достаточно  низкой  для  того,  кто  использует  этот  метод  впервые,  в 

действительности  это  по-прежнему  достаточно  вероятно.  Поэтому  мы  приходим  к  заключению,  что 

нет причин отклоняться от статуса кво, что когнитивное развитие и мотивация задачи не связаны. В 

действительности,  применяется  практическое  правило,  согласно  которому  в  данном  типе  теста 

(двусторонний тест – я снова не могу дать более подробных объяснений, но вы можете найти их) вам 

необходимо  получить  вероятность  менее 2,5%, прежде  чем  принимать  спорное  решение  о  связи 

между двумя переменными. И даже в этом случае мы не знаем наверняка, так это или нет, поэтому 

вам никогда не следует излагать свои выводы в точных формулировках.  

 

 

2. Критерии различия  



 

Как  и  в  случае  критериев  корреляции,  существуют  различные  типы  критериев  различия, 

соответствующие  характеристикам  имеющихся  у  вас  данных (относительно  уровня  измерения  и 

разброса  рассматриваемой  переменной).  Если  мы  проведем  параметрическую  проверку  различия 

(поскольку  данные  подходят  для  нее,  как  указано  в  предыдущем  разделе),  то  мы  сравним  средний 

балл  каждой  группы  по  конкретной  переменной.  Поэтому,  например,  если  мы  хотим  узнать, 

различаются  ли  баллы  девочек  и  мальчиков  по  шкале  мотивации  задачи,  то  мы  сравним  средние 

баллы  девочек  и  мальчиков  по  этой  шкале.  Элемент,  рассчитанный  в  процессе  сравнения, 

называется t-статистикой, а сам критерий называется критерием Стьюдента. Здесь в основе расчетов 

t-статистики  лежит  допущение,  что  между  двумя  рассматриваемыми  группами (т.е.  мальчиками  и 

девочками) не существует различий. 

  В SPSS t-критерии находятся под опцией «compare means» (сравнение средних значений) в меню 

«analyse». Хотя мы проводим параметрический анализ, есть различные способы сравнения средних 

значений,  которые  отражены  в  способе  выполнения  процедуры «compare  means».  Поскольку  мы 

сравниваем  две  разные  группы (мальчиков  и  девочек)  по  определенной  переменной (мотивация 

задачи),  то  это  критерий  независимых  выборок.  Это  противоречит  ситуации,  когда  вы  можете 

сравнивать  одних  людей  по  двум  разным  переменным (например,  в  моем  исследовании  я  сравнил 

баллы  учеников  по  каждой  шкале  мотивации  в  начале  и  в  конце  двухлетнего  обучения,  чтобы 

проверить,  не  изменились  ли  они),  что  потребовало  бы  использования  анализа  повторных 

измерений. Вам также необходимо указать, какие группы вы сравниваете (в «define groups» (задать 

группы)),  для  чего  вам  необходимо  вставить  коды,  заданные  вами  для  групп,  которые  вы  хотите 

сравнить (в моем случае 1 и 2, обозначающие мальчиков и девочек соответственно). Вам необходимо 

указывать группы, поскольку есть вероятность, что у вас больше групп на определенную переменную 

в  базе  данных (напр.,  я  могу  захотеть  сравнить  баллы  мотивации  задачи  для  двух  из  моих  девяти 

школ).  

 

Таблица 10.6 Критерий значимости для разницы между мальчиками и девочками по шкале мотивации задачи (наука)  

 

Статистика группы 

 

Пол 





Среднее 

Среднеквадратическое отклонение 

Среднеквадратич. 

ошибка среднего 

Мотивация 

задачи 

(наука) 


Мальчики 

625 


25.0224 

3.65273 


.14611 

Девочки 


803 

24.9763 


3.57090 

.12601 


Критерий независимых выборок  

 

 



Критерий 

Левена для 

равенства 

дисперсий 

t-критерий равенства средних 

95% интервал 

доверия 

дисперсии 

 

 



F. 

Sig 



df 

Sig. 

(двусторонняя) 

Средняя 

разница 

Ср.-кв. 

ошибка 

разницы 

Нижний  Верхний 

Мотивация 

задачи 

Равные 


дисперсии 

допуск. 


.101  .750 

.239 


1426 

.811 


.04606 

.19240 


-.33136 

.42348 


 

Равные 


дисперсии 

не допуск. 

 

 

.239 



1326.515 

.811 


.04606 

.19294 


-.33245 

.42457 


 

  В  верхней  части  таблицы  представлена  описательная  статистика,  что  удобно,  поскольку  мы  не 

нашли заранее средних баллов для мальчиков и девочек по шкале мотивации задачи (хотя обычно в 


Analysing Quantitative Data

523


иметь вероятность менее 2,5% для двустороннего критерия), очевидно, нет никаких 

доказательств отклонения от статуса кво, т.е. отсутствия разницы. Так что мы можем 

прийти к заключению, что эти данные не дают достаточно оснований предполагать, 

что мальчики и девочки имеют разную мотивацию задачи. 




Достарыңызбен бөлісу:
1   ...   56   57   58   59   60   61   62   63   ...   85




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет