An introduction to educational research methods. Введение в образовательные исследовательские методы Білім беру-зерттеу әдістеріне кіріспе


Анализ данных – наработка описательной статистики



Pdf көрінісі
бет59/85
Дата06.03.2017
өлшемі32,4 Mb.
#8078
1   ...   55   56   57   58   59   60   61   62   ...   85

Анализ данных – наработка описательной статистики

1. Проверка точности ввода данных

Первое, что вы должны проверить – это правильность ввода ваших данных, так как 

независимо от вашей тщательности, ошибки возможны. Эта «очистка» данных также 

служит началом процесса исследования данных. Одна из основных ошибок – это 

введение неверного кода для определенного ответа, например «11» вместо «1» 

(т.е. введенное значение не соответствует заданному вами коду), и самый быстрый 

способ проверить это – посмотреть на распределение частот (или сумму ответов) 

для каждой переменной. 

 

В SPSS описательная статистика, как например данные распределения частот, 



доступна через выпадающее меню «analyse». Оно включает множество вариантов 

описательной статистики, но таблицы распределения частот составляются с 

помощью частот «frequencies». После выбора этой опции SPSS выведет диалоговое 

окно, в котором необходимо указать, о частотах каких переменных вашей базы 

данных вы хотите получить информацию. Вам необходимо выбрать одну или 

несколько переменных и запросить соответствующую информацию. Программа SPSS 

сгенерирует нужные таблицы распределения частот в выходном файле SPSS, который 

появится на экране. по каждой указанной переменной вы сможете увидеть различные 

категории ответов, перечисленные в первом столбце таблицы, и количество ответов 

по этой категории – во втором столбце. Быстрый взгляд на первый столбец выявит 

наличие ошибочных ответов. В таблицах 10.2 и 10.3 показаны распределения частот 

для двух из моих переменных, «пол» и «учебная мотивация (наука)».



Analysing Quantitative Data

514


Таблица 10.2 Распределение частот по полу

Если у вас нет ошибочных значений, как в этом примере, то вы можете перейти к 

другим описательным анализам. Если вы хотите сохранить данные распределения 

частот (что вероятно, если вы планируете скопировать и вставить таблицу в отчет), 

то вы можете сохранить этот файл так же, как и любой другой файл. Если у вас есть 

какие-то нестандартные ответы, то вам нужно будет вернуться к исходным данным 

(например, исходному вопроснику), чтобы скорректировать ответ. 

2. Составление сводок переменных 

Хотя распределение частот предоставляет информацию обо всех ответах по 

определенной переменной, зачастую нам нужна более сжатая сводка, особенно 

для переменных, измеренных на интервальном уровне. Например, сведения, что 

баллы по шкале мотивации задачи (наука) в моем исследовании варьируются от 

8 до 30, не помогают нарисовать картину общего ответа по этой шкале. Если я 

скажу вам, что какой-то ученик набрал 18 баллов, то вы не будете знать, не изучив 

внимательно таблицу 10.2, типичен этот результат или нет. Для вынесения суждений 

об определенных баллах нам нужно знать две вещи. Во-первых, каков типовой ответ? 

Для этого мы обычно вычисляем средний балл (путем сложения всех отдельных 

баллов и деления суммы на количество включенных балов). Во-вторых, каков 

разброс ответов? Если разброс невелик, то большинство людей дают одинаковые 

ответы. Более широкий разброс предполагает, что баллы могут существенно 

отклоняться от среднего значения (выше и ниже). Обычным показателем является 

среднеквадратическое отклонение, обозначающее среднее отклонение от среднего 

балла. 


чтобы  обозначить  разные  причины  отсутствия  данных  –  например, «ученик  отсутствовал  в  день 

проведения теста» или «ученик пропустил один вопрос теста», но пусть значение будет простым.  

  Задав все переменные, которые вы хотите включить, можете начинать вводить свои данные. Вы 

можете  делать  это  в  режиме  Просмотр  данных (data  view),  где  заголовки  столбцов  теперь 

соответствуют  заданным  вами  переменным.  Введение  данных  –  это  просто  ввод  соответствующих 

значений  для  каждой  переменной  каждого  наблюдения.  Как  правило,  вы  вводите  все  данные  для 

первого  наблюдения,  прежде  чем  перейти  ко  второму,  но,  разумеется,  вы  можете  в  любой  момент 

вернуться  и  добавить  отсутствующие  данные,  собранные  позднее.  Так  что  в  своей  базе  данных  я 

начал  с  первого  ученика,  для  которого  у  меня  были  данные,  и  ввел «1001» в  столбце «ID», «2» в 

столбце «Пол», поскольку это была девочка, и т.д. Если вы забыли какие-то свои коды, то вы всегда 

можете проверить их в метках значений в режиме Просмотр переменных. Не забудьте периодически 

выполнять сохранение.  

  Во  время  ввода  данных  вы,  вероятно,  столкнетесь  с  какими-то  проблемами,  например,  ученики, 

выбравшие  два  ответа  в  своей  анкете.  Их  можно  решить  разными  способами.  Вы  можете  либо 

вернуться к ученику и попросить его пояснить свой ответ (что отнимает время); вы можете занести 

его  как  отсутствующий  ответ (вероятно,  лучшее  решение,  но  тогда  вы  потеряете  данные),  или  вы 

можете  решить  внести  новые  значения,  чтобы  получить  средние  точки  для  шкал (но  это  может 

исказить будущий анализ). Какой бы способ вы ни выбрали, применяйте его всегда.  

 

 

Анализ данных – наработка описательной статистики 



 

 

1. Проверка точности ввода данных 



 

Первое,  что  вы  должны  проверить  –  это  правильность  ввода  ваших  данных,  так  как  независимо  от 

вашей  тщательности,  ошибки  возможны.  Эта «очистка»  данных  также  служит  началом  процесса 

исследования данных. Одна из основных ошибок – это введение неверного кода для определенного 

ответа, например «11» вместо «1» (т.е. введенное значение не соответствует заданному вами коду), 

и самый быстрый способ проверить это – посмотреть на распределение частот (или сумму ответов) 

для каждой переменной.  

  В  SPSS  описательная  статистика,  как  например  данные  распределения  частот,  доступна  через 

выпадающее  меню «analyse».  Оно  включает  множество  вариантов  описательной  статистики,  но 

таблицы  распределения  частот  составляются  с  помощью  частот «frequencies».  После  выбора  этой 

опции SPSS выведет диалоговое окно, в котором необходимо указать, о частотах каких переменных 

вашей базы данных вы хотите получить информацию. Вам необходимо выбрать одну или несколько 

переменных  и  запросить  соответствующую  информацию.  Программа  SPSS  сгенерирует  нужные 

таблицы  распределения  частот  в  выходном  файле  SPSS,  который  появится  на  экране.  по  каждой 

указанной переменной вы сможете увидеть различные категории ответов, перечисленные в первом 

столбце таблицы, и количество ответов по этой категории – во втором столбце. Быстрый взгляд на 

первый столбец выявит наличие ошибочных ответов. В таблицах 10.2 и 10.3 показаны распределения 

частот для двух из моих переменных, «пол» и «учебная мотивация (наука)». 

 

Таблица 10.2 Распределение частот по полу 

 

 



 

Frequency / 

Частота 

Per cent / % 

Valid per cent / % 

действительный 

Cumulative per cent / 

Совокупный процент 

Действительно 

Мальчики  710 

41.2 


43.0 

43.0  


 

Девочки 


942 

54.7 


57.0 

100.0  


 

Итого 


1652 

95.9 


100.0 

 

Отсутствует 



9.00 

71 


4.1 

 

 



Итого 

 

1723 



100.0 

 

 



 

Если  у  вас  нет  ошибочных  значений,  как  в  этом  примере,  то  вы  можете  перейти  к  другим 

описательным  анализам.  Если  вы  хотите  сохранить  данные  распределения  частот (что  вероятно, 

если вы планируете скопировать и вставить таблицу в отчет), то вы можете сохранить этот файл так 

же,  как и любой другой файл.  Если у вас есть какие-то нестандартные  ответы,  то вам нужно будет 

вернуться  к  исходным  данным (например,  исходному  вопроснику),  чтобы  скорректировать  ответ. 



Analysing Quantitative Data

515


Таблица 10.3 Распределение частот для мотивации задачи (наука)

Для получения общей статистики, включая среднее и среднеквадратическое 

отклонение (обычно называется в литературе описательной статистикой), 

используется опция «descriptives» описательной статистики. Общая статистика 

по полу (gender) и мотивации задачи (наука) (task motivation (science)) и уровню 

когнитивного развития (level of cognitive development) указаны в таблице 10.4. 

 

Возвращаясь к вопросу о том, является ли балл 18 низким на шкале 



мотивации задачи (наука), зная, что средний бал равен 25,0 (с округлением) и 

среднеквадратическое отклонение составляет 3,6, можно утверждать, что балл 18 

необычно низкий, поскольку большинство людей набрали от 21,4 (на 3,6 ниже 25) до 

28,6. 


 

В таблице 10.4 также проиллюстрирован важный момент, о котором 

необходимо помнить, используя компьютерную программу. Поскольку пол является 

переменной номинального уровня, то бессмысленно говорить о среднем или 

среднем арифметическом поле, поскольку мои участники определенно были либо 

мальчиками, либо девочками. Однако SPSS при необходимости рассчитает это 

значение. Вам всегда необходимо задавать себе вопрос – имеет ли смысл то, что я 

прошу компьютер рассчитать? Проще говоря, что посеешь, то и пожнешь! 



Таблица 10.3 Распределение частот для мотивации задачи (наука)

 

2. Составление сводок переменных  



 

Хотя  распределение  частот  предоставляет  информацию  обо  всех  ответах  по  определенной 

переменной,  зачастую  нам  нужна  более  сжатая  сводка,  особенно  для  переменных,  измеренных  на 

интервальном  уровне.  Например,  сведения,  что  баллы  по  шкале  мотивации  задачи (наука)  в  моем 

исследовании варьируются от 8 до 30, не помогают нарисовать картину общего ответа по этой шкале. 

Если  я  скажу  вам,  что  какой-то  ученик  набрал 18 баллов,  то  вы  не  будете  знать,  не  изучив 

внимательно  таблицу 10.2, типичен  этот  результат  или  нет.  Для  вынесения  суждений  об 

определенных  баллах  нам  нужно  знать  две  вещи.  Во-первых,  каков  типовой  ответ?  Для  этого  мы 

обычно  вычисляем  средний  балл (путем  сложения  всех  отдельных  баллов  и  деления  суммы  на 

количество  включенных  балов).  Во-вторых,  каков  разброс  ответов?  Если  разброс  невелик,  то 

большинство  людей  дают  одинаковые  ответы.  Более  широкий  разброс  предполагает,  что  баллы 

могут существенно отклоняться от среднего значения (выше и ниже). Обычным показателем является 

среднеквадратическое отклонение, обозначающее среднее отклонение от среднего балла.  

 

Таблица 10.3 Распределение частот для мотивации задачи (наука) 

 

 

 



Частота 

Процент 

% действительно 

Общий процент 

Действительно 

8.00 



.1 



.1 

.1  


 

9.00 


.1 


.1 

.1  


 

10.00 


.2 


.2 

.4  


 

11.00 


.1 


.1 

.4  


 

13.00 


.2 


.3 

.7  


 

14.00 


.3 


.4 

1.1  


 

15.00 


.5 


.6 

1.8  


 

16.00 


.5 


.6 

2.3  


 

17.00 


14 

.8 


1.0 

3.3  


 

18.00 


31 

1.8 


2.2 

5.5  


 

19.00 


32 

1.9 


2.2 

7.7  


 

20.00 


52 

3.0 


3.6 

11.3  


 

21.00 


66 

3.8 


4.6 

16.0  


 

22.00 


88 

5.1 


6.2 

22.1  


 

23.00 


111 

6.4 


7.8 

29.9  


 

24.00 


131 

7.6 


9.2 

39.1  


 

25.00 


144 

8.4 


10.1 

49.2  


 

26.00 


167 

9.7 


11.7 

60.9  


 

27.00 


159 

9.2 


11.1 

72.0  


 

28.00 


167 

9.7 


11.7 

83.7  


 

29.00 


126 

7.3 


8.8 

92.5  


 

30.00 


107 

6.2 


7.5 

100.0  


 

Итого 


1428 

82.9 


100.0 

 

Отсутствует1 



 

295 


17.1 

 

 



Итого 

 

1723 



100.0 

 

 



 

Примечание: 1 Отсутствующие ответы фигурируют потому, что ученики не дали ответов на один или несколько вопросов из 

списка, составляющих шкалу мотивации задачи (наука).  

 


Analysing Quantitative Data

516


Таблица 10.4

 Описательная статистика по полу, мотивацию задачи (наука) и уровню 

когнитивного развития 

3. Составление графиков 

Распределение частот зачастую проще понять, составив графики, вместо того, 

чтобы изучать таблицы или сводную статистику. Например, вы увидели таблицу 

распределения частот и знаете, что средний бал по шкале мотивации задачи 

(наука) составляет 25,0, тогда как баллы варьировались от 8 до 30, и разброс был 

относительно мал, поскольку среднеквадратическое отклонение составляет 3,6. Если 

вы внимательно обдумаете эти значения, то это позволит предположить, что баллы 

сконцентрировались у верхнего конца шкалы. Это можно увидеть более наглядно

построив гистограмму, являющуюся графиком распределения частот. 

 

 В SPSS графики можно строить с помощью выпадающего меню «graph», 



которое позволяет создать гистограмму. Гистограмма для шкалы мотивации 

задачи (наука) показана на рисунке 10.1 и, как и ожидалось, баллы учеников 

сконцентрировали в верхней части шкалы. Эта шкала касается изучения предметов, 

поэтому неудивительно, что многие ученики сказали, что их это мотивирует, 

учитывая, что они знают, что их ответы будет изучать кто-то еще. 

 

  Для получения общей статистики, включая среднее и среднеквадратическое отклонение (обычно 



называется в литературе описательной статистикой), используется опция «descriptives» описательной 

статистики. Общая статистика по полу (gender) и мотивации задачи (наука) (task motivation (science)) и 

уровню когнитивного развития (level of cognitive development) указаны в таблице 10.4.  

  Возвращаясь  к  вопросу  о  том,  является  ли  балл 18 низким  на  шкале  мотивации  задачи (наука), 

зная, что средний бал равен 25,0 (с округлением) и среднеквадратическое отклонение составляет 3,6, 

можно утверждать, что балл 18 необычно низкий, поскольку большинство людей набрали от 21,4 (на 

3,6 ниже 25) до 28,6.  

  В  таблице 10.4 также  проиллюстрирован  важный  момент,  о  котором  необходимо  помнить, 

используя  компьютерную  программу.  Поскольку  пол  является  переменной  номинального  уровня,  то 

бессмысленно  говорить  о  среднем  или  среднем  арифметическом  поле,  поскольку  мои  участники 

определенно были либо мальчиками, либо девочками. Однако SPSS при необходимости рассчитает 

это  значение.  Вам  всегда  необходимо  задавать  себе  вопрос  –  имеет  ли  смысл  то,  что  я  прошу 

компьютер рассчитать? Проще говоря, что посеешь, то и пожнешь!  

 

Таблица 10.4 Описательная статистика по полу, мотивацию задачи (наука) и уровню когнитивного развития  

 

 

N 



Минимум 

Максимум 

Среднее 

Среднеквад. 

отклонение 

Пол 


1652 

1.00  


2.00  

1.5702  


.49519 

Мотивация задачи (наука) 

1428 

8.00 


30.00 

24.9965 


3.60574 

Уровень когнитивного развития 

1723 

2.00  


9.00  

6.1977 


2.18647 

 

 



3. Составление графиков  

 

Распределение  частот  зачастую  проще  понять,  составив  графики,  вместо  того,  чтобы  изучать 



таблицы или сводную статистику. Например, вы увидели таблицу распределения частот и знаете, что 

средний бал по шкале мотивации задачи (наука) составляет 25,0, тогда как баллы варьировались от 8 

до 30, и разброс был относительно мал, поскольку среднеквадратическое отклонение составляет 3,6. 

Если  вы  внимательно  обдумаете  эти  значения,  то  это  позволит  предположить,  что  баллы 

сконцентрировались  у  верхнего  конца  шкалы.  Это  можно  увидеть  более  наглядно,  построив 

гистограмму, являющуюся графиком распределения частот.  

   В  SPSS  графики  можно  строить  с  помощью  выпадающего  меню «graph»,  которое  позволяет 

создать гистограмму. Гистограмма для шкалы мотивации задачи (наука) показана на рисунке 10.1 и, 

как  и  ожидалось,  баллы  учеников  сконцентрировали  в  верхней  части  шкалы.  Эта  шкала  касается 

изучения  предметов,  поэтому  неудивительно,  что  многие  ученики  сказали,  что  их  это  мотивирует, 

учитывая, что они знают, что их ответы будет изучать кто-то еще.  

 


Analysing Quantitative Data

517


Рисунок 10.1 Гистограмма, демонстрирующая разброс ответов по шкале 

мотивации задачи (наука)

Второй тип графика, полезного для описательного анализа данных, который также 

является опцией выпадающего меню, является диаграмма разброса данных. Она 

показывает взаимосвязь между двумя переменными интервального уровня. Например, 

меня очень интересовало, имелась ли взаимосвязь между баллами когнитивного 

развития учеников и их баллами по мотивации. Я ожидал, что ученики, указавшие, что 

они мотивированы на приложение усилий, чтобы узнавать новые вещи, развивают 

свои когнитивные способности. Диаграмма разброса поможет мне решить, была ли я 

права в отношении такой взаимосвязи; диаграмма представлена на рисунке 10.2. 

 

 



 

 

Рисунок 10.1 Гистограмма, демонстрирующая разброс ответов по шкале мотивации задачи (наука) 

 

 

Второй тип графика, полезного для описательного анализа данных, который также является опцией 



выпадающего  меню,  является  диаграмма  разброса  данных.  Она  показывает  взаимосвязь  между 

двумя  переменными  интервального  уровня.  Например,  меня  очень  интересовало,  имелась  ли 

взаимосвязь между баллами когнитивного развития учеников и их баллами по мотивации. Я ожидал, 

что ученики, указавшие, что они мотивированы на приложение усилий, чтобы узнавать новые вещи, 

развивают  свои  когнитивные  способности.  Диаграмма  разброса  поможет  мне  решить,  была  ли  я 

права в отношении такой взаимосвязи; диаграмма представлена на рисунке 10.2.  



Мотивация задачи (наука) 

Ч

аст

от

а 

Сред. 


Сред-кв. 

Analysing Quantitative Data

518


Рисунок 10.2 Диаграмма разброса, демонстрирующая взаимосвязь между 

мотивацией задачи (наука) и уровнем когнитивного развития 

Каждый кружок представляет баллы одного или нескольких учеников по 

интересующим переменным. Например, кружок в нижней правой части графика 

представляет учеников, набравших 30 (максимальное значение) по шкале мотивации 

задачи (наука) (так что они крайне мотивированы на изучение нового), но в то же 

время набрали наименьший балл 2 в тесте на уровень когнитивного развития. Так 

что для этих учеников стремление узнавать новое, по-видимому, не помогает им 

развивать свои когнитивные способности. Как правило, в случае положительной 

связи, которую статистики называют положительной корреляцией, между мотивацией 

задачи и уровнем когнитивного развития график покажет ряд кружков, следующих 

воображаемой линии, идущей из нижнего левого в правый верхний угол графика (т.е. 

поднимающейся). Здесь у нас имеется общий поток кружков, заполняющих большую 

часть графика, не предполагая наличия никакой взаимосвязи (или отсутствие 

корреляции) между мотивацией задачи и уровнем когнитивного развития. Это не 

то, что я ожидала. Обратите внимание, что можно также получить отрицательную 

корреляцию между двумя переменными. Например, можно ожидать отрицательной 

корреляции между отчуждением и когнитивным развитием, что будет иметь вид 

полосы кружков, следующих воображаемой линии из верхнего левого в нижний 

правый угол (т.е. опускающейся). 

 

 



 

Рисунок 10.2 Диаграмма разброса, демонстрирующая взаимосвязь между мотивацией задачи (наука) 

и уровнем когнитивного развития  

 

 

Каждый кружок представляет баллы одного или нескольких учеников по интересующим переменным. 



Например,  кружок  в  нижней  правой  части  графика  представляет  учеников,  набравших 30 

(максимальное значение) по шкале мотивации задачи (наука) (так что они крайне мотивированы на 

изучение  нового),  но  в  то  же  время  набрали  наименьший  балл 2 в  тесте  на  уровень  когнитивного 

развития.  Так  что  для  этих  учеников  стремление  узнавать  новое,  по-видимому,  не  помогает  им 

развивать  свои  когнитивные  способности.  Как  правило,  в  случае  положительной  связи,  которую 

статистики называют положительной корреляцией, между мотивацией задачи и уровнем когнитивного 

развития график покажет ряд кружков, следующих воображаемой линии, идущей из нижнего левого в 

правый  верхний  угол  графика (т.е.  поднимающейся).  Здесь  у  нас  имеется  общий  поток  кружков, 

заполняющих большую часть графика, не предполагая наличия никакой взаимосвязи (или отсутствие 

корреляции) между мотивацией задачи и уровнем когнитивного развития. Это не то, что я ожидала. 

Обратите  внимание,  что  можно  также  получить  отрицательную  корреляцию  между  двумя 

переменными.  Например,  можно  ожидать  отрицательной  корреляции  между  отчуждением  и 

когнитивным  развитием,  что  будет  иметь  вид  полосы  кружков,  следующих  воображаемой  линии  из 

верхнего левого в нижний правый угол (т.е. опускающейся).  

 

 



Достарыңызбен бөлісу:
1   ...   55   56   57   58   59   60   61   62   ...   85




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет