ROS MCLELLAN
ГЛАВА 10
Обзор главы
Данная глава посвящена использованию некоторых статистических
методов для анализа и интерпретации количественных данных. Мы не
утверждаем, что закончив чтение этой главы, вы станете экспертом, но у
вас появится достаточная уверенность, чтобы начать работу. Те из вас, кто
желает использовать данный метод работы, должны будут изучить больше
специализированных текстов, и в конце главы перечислены некоторые
подходящие работы, к которым вам необходимо будет перейти.
Analysing Quantitative Data
508
Введение
Давайте начнем с развенчивания мифа. Вам не нужно быть сильными в математике, чтобы
проводить количественный анализ. Многих отпугивают сложные на вид уравнения, но
компьютеры смогут производить вычисления за вас, и на одном уровне вам не нужно
понимать сложные символы, которые вы можете встретить в специализированных
работах по статистике. Важно, чтобы вы понимали некоторые базовые принципы, и
какие виды анализа подходят для ответа на конкретные вопросы. Подходящая аналогия
– вождение автомобиля: вам нужно знать, как заправлять машину (основной принцип
топлива, дающего движущую силу) и как водить (правильный метод для определенной
ситуации – например, не тормозить слишком резко морозным утром), но вам не
нужно понимать механические и электрические инженерные принципы, заставляющим
ее работать, если вы хотите просто водить ее. То же самое и со статистикой: вам
необходимо знать статистические категории, которые вы можете вычислить, и что
подходит к конкретной ситуации, но вам не нужно иметь точного представления о
том, как компьютер обрабатывает данные для вычисления этих категорий. Поэтому
цель данной главы – представить вам определенный статистический пакет программ,
SPSS, широко применяемый для подобных вычислений.
Другой важный момент, который хотелось бы подчеркнуть прежде, чем мы
перейдем к нашей теме, это то, что анализ не следует начинать обдумывать после сбора
всех своих данных. Это частая ошибка, совершаемая неопытными исследователями.
Если вы не думаете об анализе до сбора данных, то весьма вероятно, что ваши
данные не смогут ответить на задаваемые вами вопросы. Например, если вы хотели
исследовать взаимосвязь между способностями и мотивацией, то будет недостаточным
использовать способность потока в качестве индикатора способности, если вы
хотели узнать, отличается ли мотивация самых способных учеников в начале потока
от тех, кто едва попал в этот поток. Необходимо использовать более мелкую шкалу
или инструмент для измерения способностей, как например тесты на когнитивную
способность NFER. Поэтому вам необходимо заранее продумать те типы вопросов,
которые вы хотите задать, чтобы спланировать сбор данных соответствующим
образом. Как правило, данные собираются на самом высоком уровне измерения,
который вы обоснованно сможете освоить, поскольку вы можете создать дискретные
категории на основании данных, замеренных по непрерывной шкале (как например
категории способностей «низкие», «средние» и «высокие» путем определения
граничных точек на шкале способностей), хотя вы не можете создать непрерывную
шкалу из дискретных категорий.
Теперь должно быть понятно, что важно обдумать тип анализа на начальных
этапах планирования исследования, чтобы, прежде всего, по возможности собирать
подходящие данные. Поэтому, если вы еще не прочли главу 9, я настоятельно
рекомендую вам хотя бы просмотреть ее, прежде чем двигаться дальше.
Теперь можем вернуться к основной теме – анализу количественных данных.
Предполагая, что вы планируете использовать компьютер для помощи в работе, первым
этапом является создание базы данных с помощью подходящего программного
обеспечения. В этой главе мы будем ссылаться на пакет SPSS, поскольку это самая
Analysing Quantitative Data
509
распространенная программа подобного типа в социальных науках, и большинство
высших учебных заведений используют ее. После введения данных можно проводить
анализ, состоящий из двух отдельных этапов. Первый этап – описание собранных данных,
что включает вычисление описательной статистики и графическое представление
данных. Второй этап – это перепроверка данных для ответа на заданные вопросы, что
включает вычисление статистики вывода. В оставшейся части главы приводится обзор
каждого из этих этапов. Поскольку такие процессы легче понять, если рассматривать их
на конкретном примере, то данные, собранные в ходе моего исследования на степень
PhD, будут использованы для иллюстрации. Я начну с краткого описания моего PhD
исследования, чтобы увязать с контекстом примеры, приведенные в остальной главе.
Пример базы данных
Наука мыслить и наука для мышления: изложение когнитивной акселерации через
естественнонаучное образование (Cognitive Acceleration through Science Education
(CASE)) – это экспериментальная программа, состоящая из 30 естественнонаучных
уроков для школьников 7 и 8 класса, направленная на когнитивное развитие. Она
широко применяется в средних школах, несмотря на тот факт, что некоторые студенты
демонстрируют весьма ограниченные успехи, и было выдвинуто предположение,
что причиной тому может быть мотивация студентов, но эта гипотеза не была
исследована. Соответственно, основная цель моего исследования заключалась в
следующем: «Объясняется ли различие результатов учеников в ходе CASE разницей
в их мотивации?» Мне также была интересна разница успехов мальчиков и девочек,
поскольку литература позволяет предположить, что девочки более мотивированы, чем
мальчики; и что в школе в целом девочки получают на экзаменах более высокие отметки,
чем мальчики. Применяя продольный квази экспериментальный подход для сравнения
учеников, занимающихся по программе CASE, с учениками, не участвующими в ней
(чтобы сделать поправку на нормальное когнитивное развитие), отслеживалась группа
(более 1700 учеников) в течение последних двух лет обучения в девяти средних
школах (пять из которых используют программу CASE, а четыре нет). Это, вероятно,
намного больше учеников, чем вы рассчитывали задействовать в своем исследовании,
так как, скорее всего, вы исследуете учеников собственной школы. Однако процесс
анализа будет одинаковым, если ваша выборка составляет 1700 учеников, один выпуск
или один класс.
Мы оценили когнитивное развитие и мотивацию в начале седьмого года
обучения (до начала CASE – предварительный тест) и в конце 8 года обучения (после
окончания программы – последующий тест), чтобы измерить изменения в когнитивном
развитии. Также смогли определить, произошли ли какие-либо изменения в мотивации.
Здесь мы затронем лишь некоторые данные, собранные в ходе предварительного
теста. Был использован стандартный тест для измерения когнитивного развития
(задание на научное мышление). Тест проводится в виде серии проводимых учителем
демонстраций, о которых затем ученики должны ответить на вопросы, заполнив
бланк. Ответы помечаются с помощью приложенной схемы, после чего общий
балл преобразуется в уровень когнитивного развития (числовой балл, являющийся
Analysing Quantitative Data
510
интервальным уровнем измерения).
Мотивацию можно измерить различными способами, в зависимости от того,
какой теории мотивации вы придерживаетесь. Была выбрана теория, предполагающая
существование четырех измерений мотивации. Каждое измерение можно оценить с
помощью шкалы, включающей ряд объектов, на которые должны ответить ученики.
Я использовал опросник, задействованный в предыдущем исследовании. У каждого
объекта есть общее начало – «Я чувствую себя на высоте, когда…» - и ученик указывает,
насколько он согласен с этим высказыванием, по пятибалльной шкале Ликерта (Likert)
(от «совершенно не согласен» - 1 балл до «абсолютно согласен» - 5 баллов). Общий
балл по каждому измерению – это сумма баллов за отдельные объекты в каждой шкале.
Пример объекта по каждой из четырех шкал представлен в таблице 10.1, чтобы дать
представление о том, к чему относятся четыре измерения.
Я попросила учеников высказать свое мнение о науке, английском языке
и школе в целом, поскольку меня интересовали эти разные области. Поэтому база
данных содержала три ответа на каждый объект, и отдельные общие баллы за каждое
измерение для различных предметов. Теперь, получив представление о собранных
мной данных, мы можем рассмотреть, как я составила базу данных SPSS для проведения
анализа.
Таблица 10.1 Примеры вопросов из вопросника по мотивации
Задание 10.1
Собрать данные из вопросника «По мотивации» (см. приложение в конце
главы). Использовать эти данные для выполнения описанных в тексте
действий, чтобы понять, как использовать SPSS.
моего исследования на степень PhD, будут использованы для иллюстрации. Я начну с краткого
описания моего PhD исследования, чтобы увязать с контекстом примеры, приведенные в остальной
главе.
Пример базы данных
Наука мыслить и наука для мышления: изложение когнитивной акселерации через
естественнонаучное образование (Cognitive Acceleration through Science Education (CASE)) – это
экспериментальная программа, состоящая из 30 естественнонаучных уроков для школьников 7 и 8
класса, направленная на когнитивное развитие. Она широко применяется в средних школах,
несмотря на тот факт, что некоторые студенты демонстрируют весьма ограниченные успехи, и было
выдвинуто предположение, что причиной тому может быть мотивация студентов, но эта гипотеза не
была исследована. Соответственно, основная цель моего исследования заключалась в следующем:
«Объясняется ли различие результатов учеников в ходе CASE разницей в их мотивации?» Мне также
была интересна разница успехов мальчиков и девочек, поскольку литература позволяет
предположить, что девочки более мотивированы, чем мальчики; и что в школе в целом девочки
получают на экзаменах более высокие отметки, чем мальчики. Применяя продольный квази
экспериментальный подход для сравнения учеников, занимающихся по программе CASE, с
учениками, не участвующими в ней (чтобы сделать поправку на нормальное когнитивное развитие),
отслеживалась группа (более 1700 учеников) в течение последних двух лет обучения в девяти
средних школах (пять из которых используют программу CASE, а четыре нет). Это, вероятно, намного
больше учеников, чем вы рассчитывали задействовать в своем исследовании, так как, скорее всего,
вы исследуете учеников собственной школы. Однако процесс анализа будет одинаковым, если ваша
выборка составляет 1700 учеников, один выпуск или один класс.
Мы оценили когнитивное развитие и мотивацию в начале седьмого года обучения (до начала
CASE – предварительный тест) и в конце 8 года обучения (после окончания программы –
последующий тест), чтобы измерить изменения в когнитивном развитии. Также смогли определить,
произошли ли какие-либо изменения в мотивации. Здесь мы затронем лишь некоторые данные,
собранные в ходе предварительного теста. Был использован стандартный тест для измерения
когнитивного развития (задание на научное мышление). Тест проводится в виде серии проводимых
учителем демонстраций, о которых затем ученики должны ответить на вопросы, заполнив бланк.
Ответы помечаются с помощью приложенной схемы, после чего общий балл преобразуется в
уровень когнитивного развития (числовой балл, являющийся интервальным уровнем измерения).
Мотивацию можно измерить различными способами, в зависимости от того, какой теории
мотивации вы придерживаетесь. Была выбрана теория, предполагающая существование четырех
измерений мотивации. Каждое измерение можно оценить с помощью шкалы, включающей ряд
объектов, на которые должны ответить ученики. Я использовал опросник, задействованный в
предыдущем исследовании. У каждого объекта есть общее начало – «Я чувствую себя на высоте,
когда…» - и ученик указывает, насколько он согласен с этим высказыванием, по пятибалльной шкале
Ликерта (Likert) (от «совершенно не согласен» - 1 балл до «абсолютно согласен» - 5 баллов). Общий
балл по каждому измерению – это сумма баллов за отдельные объекты в каждой шкале. Пример
объекта по каждой из четырех шкал представлен в таблице 10.1, чтобы дать представление о том, к
чему относятся четыре измерения.
Таблица 10.1 Примеры вопросов из вопросника по мотивации
Шкала
Базовая мотивация
Пример объекта
1
Задача
Чтобы развить умения
… я, наконец, понимаю действительно
сложную идею
Эго
Чтобы продемонстрировать умения
… я выполняю задания лучше других
учеников
Уклонение от
работы
Чтобы не показывать некомпетентности
(пассивное уклонение)
… я не должен выполнять домашнюю работу
Отчуждение
Чтобы не показывать некомпетентности
(активное невыполнение)
… я бездельничаю, и мне сходит это с рук
Примечание:
1
Общее начало «Я чувствую себя на высоте, когда».
Я попросила учеников высказать свое мнение о науке, английском языке и школе в целом, поскольку
меня интересовали эти разные области. Поэтому база данных содержала три ответа на каждый
объект, и отдельные общие баллы за каждое измерение для различных предметов. Теперь, получив
представление о собранных мной данных, мы можем рассмотреть, как я составила базу данных SPSS
для
проведения
анализа.
Analysing Quantitative Data
511
Создание базы данных в SPSS
В этом разделе мы рассмотрим некоторые аспекты, которые вам необходимо
учитывать при составлении базы данных SPSS, иллюстрируя их примерами из моей
собственной базы данных. Если вы перейдете на сайт, то там вы найдете инструкции
по составлению базы данных с помощью SPSS, которые вы, вероятно, найдете
полезными в рамках данного раздела. В конце раздела находится задание, чтобы
проверить, насколько вы поняли, как создать базу данных. Пустые базы данных в
SPSS выглядят похожими на листы Excel, когда вы открываете их впервые, однако
в отличие от Excel, базу данных можно отображать двумя способами: «Просмотр
данных» (data view) и «Просмотр переменных» (variable view).
«Просмотр данных» (выбрано по умолчанию при открытии базы данных)
позволяет видеть сами данные, занесенные в вашу базу. Каждая строка соответствует
одному «наблюдению» (case). Я собрала данные примерно 1700 учеников, поэтому
в моей базе данных примерно 1700 строк. Наблюдения не обязательно должны
соответствовать отдельным людям. Если, например, вы собираете данные о школах, а
не об учениках, то строки будут представлять каждую школу. Столбцы представляют
каждую переменную, по которой вы собрали данные. В моем исследовании это были
демографические данные (как например пол), балл уровня когнитивного развития,
и ответы на каждый из вопросов вопросника. Также я создал в базе данных ряд
переменных из существующих переменных. Например, есть переменные общего
балла по каждому измерению мотивации.
«Просмотр переменных» содержит информацию о каждой из ваших
переменных. Это одно из отличий SPSS от электронной таблицы – поскольку
это база данных, то она может содержать все виды полезной информации о
ваших переменных, на которые неспособна таблица Excel, и эта информация
необходима для проведения статистического анализа. Прежде чем вносить данные,
вы задаете свои переменные в режиме Просмотр переменных. Здесь каждая
строка соответствует одной переменной, а столбцы представляют отдельные
характеристики переменной. Чтобы избежать сожалений в будущем, рекомендуется
полностью определить свои переменные, прежде чем вносить данные, поскольку
SPSS имеет стандартные настройки по умолчанию, которые могут подходить не для
всех ваших переменных.
Независимо от того, для чего у вас есть данные, целесообразно задать свою
первую переменную как уникальный идентификатор каждого наблюдения, чтобы у
вас была возможность при необходимости вернуться к исходным собранным данным
позднее. Для защиты данных и по этическим соображениям вам следует задать
идентификатор в виде кода, а не типа. Поэтому я назвал свою первую переменную
«ID». Имя переменной ограничивается восемью знаками, и если вы попытаетесь
ввести больше знаков, то SPSS их обрежет. Однако вы можете ввести имя
полностью, например, «уникальный идентификатор» под «меткой» (label), и позднее
во время анализа SPSS использует в своих конечных результатах то, что указано под
меткой, а не имя переменной.
Analysing Quantitative Data
512
Для остальных заголовков SPSS сгенерирует информацию по умолчанию.
Хотя большинство из них не подходят, вам необходимо выбрать тип (type), метка
значений (values), отсутствующие значения (missing) и шкала измерения (measure).
В SPSS сохранены для них различные опции. Например, в качестве типа вы можете
выбрать одну из множества опций, включая числовую и строковую. Я решил, что
самым простым идентификатором каждого ответа ученика будет присвоение
каждому ученику номера и проставление этого номера в его вопросниках/ бланках
теста на когнитивное развитие. Поэтому я выбрал «численный» (numerical) в графе
типа переменной (type) в качестве идентификатора переменной (ID). Возможно,
вы захотите присвоить нечисловые коды, например, псевдонимы (но имейте в виду,
что если у вас большое количество наблюдений, но это быстро станет запутанным,
так что зачастую лучше использовать числа). В этом случае вы выбираете в качестве
типа переменной «строковая» (string), и в обоих случаях шкала измерения (measure)
будет номинальной (nominal).
Чтобы понять, как использовать метку значений (values) и отсутствующие
значения (missing), следует обратиться к другой переменной. Я хотел записать
некоторую базовую демографическую информацию, и весьма вероятно, что вы
сделаете то же. Например, я хотела указать пол каждого ученика. Думая наперед,
я знала, что захочу сравнить мальчиков и девочек по ряду показателей (например,
баллы по шкале мотивации «Задача»). Для такого вида анализа вам необходимо
создавать численные, а не строковые переменные, поэтому в качестве типа
переменной я выбрала «численный» (numerical) и в шкале измерения (measure)
я выбрала номинальную (nominal). Кодом 1 я обозначила мальчиков и кодом 2 –
девочек, и занесла эту информацию в графу метки значений (values). Как и в случае
меток переменных, SPSS показывает в анализе метки значений, а не численные коды,
что удобно, поскольку вам не нужно запоминать, обозначает ли «1» мальчиков или
девочек (хотя, разумеется, вы в любой момент можете проверить это в режиме
Просмотр переменных).
Важно задать отсутствующие значения (missing) для переменных, данные
для которых могут отсутствовать. Например, хотя учеников попросили указать
свой пол в начале анкеты, некоторые этого не делают, и поскольку пол не всегда
можно определить по имени (например, Сэм может быть как девочкой, так и
мальчиком), в этих случаях его необходимо указать как отсутствующее значение.
Задание специального числового кода для отсутствующих данных позволяет SPSS
распознавать наблюдения, данные по которым отсутствуют, и исключать их из
конкретного анализа. Вы задаете одно или несколько значений, представляющих
отсутствующие данные, в графе «missing». Как правило, вы задаете одно значение,
которое может быть каким угодно, если это значение не было ранее использовано
в вашем коде (так что я не мог указать 1 или 2 для пола), но традиционно
исследователи используют «9» или «99», чтобы отсутствующие данные были
заметны. Вы можете использовать разные значения для разных переменных, но я
бы не советовал этого делать, поскольку это может внести путаницу. Вы можете
задать больше одного отсутствующего значения, чтобы обозначить разные причины
отсутствия данных – например, «ученик отсутствовал в день проведения теста» или
«ученик пропустил один вопрос теста», но пусть значение будет простым.
Analysing Quantitative Data
513
Задав все переменные, которые вы хотите включить, можете начинать
вводить свои данные. Вы можете делать это в режиме Просмотр данных (data view),
где заголовки столбцов теперь соответствуют заданным вами переменным. Введение
данных – это просто ввод соответствующих значений для каждой переменной
каждого наблюдения. Как правило, вы вводите все данные для первого наблюдения,
прежде чем перейти ко второму, но, разумеется, вы можете в любой момент
вернуться и добавить отсутствующие данные, собранные позднее. Так что в своей
базе данных я начал с первого ученика, для которого у меня были данные, и ввел
«1001» в столбце «ID», «2» в столбце «Пол», поскольку это была девочка, и т.д. Если
вы забыли какие-то свои коды, то вы всегда можете проверить их в метках значений
в режиме Просмотр переменных. Не забудьте периодически выполнять сохранение.
Во время ввода данных вы, вероятно, столкнетесь с какими-то проблемами,
например, ученики, выбравшие два ответа в своей анкете. Их можно решить разными
способами. Вы можете либо вернуться к ученику и попросить его пояснить свой
ответ (что отнимает время); вы можете занести его как отсутствующий ответ
(вероятно, лучшее решение, но тогда вы потеряете данные), или вы можете решить
внести новые значения, чтобы получить средние точки для шкал (но это может
исказить будущий анализ). Какой бы способ вы ни выбрали, применяйте его всегда.
Достарыңызбен бөлісу: |