Статистическая проверка научной гипотезы. Доказательство статистической достоверности экспериментального влияния существенно отличается от доказательства в математике и формальной логике, где выводы носят более универсальный характер: статистические доказательства не являются столь строгими и окончательными—в них всегда допускается риск ошибиться в выводах, и потому
153
статистическими методами не доказывается окончательно правомерность того или иного вывода, а показывается мера правдоподобности принятия той или иной гипотезы.
Педагогическая гипотеза (научное предположение о преимуществе того или иного метода и т. п.) в процессе статистического анализа переводится на язык статистической науки и заново формулируется, по меньшей мере, в виде двух статистических гипотез. Первая (основная) называется нулевой гипотезой (#0), в которой исследователь говорит о своей исходной позиции. Он априори как бы декларирует, что новый метод (предполагаемый им, его коллегами или оппонентами) не обладает какими-либо преимуществами, и потому с самого начала исследователь психологически готов занять честную научную позицию: различия между новым и старым методами объявляются равными нулю. В другой, альтернативной гипотезе (Я,) делается предположение о преимуществе нового метода. Иногда выдвигается несколько альтернативных гипотез с соответствующими обозначениями.
Например, гипотеза о преимуществе старого метода обозначается как (Н2). Альтернативные гипотезы принимаются тогда и только тогда, когда опровергается нулевая гипотеза. Это бывает в случаях, когда различия, скажем, в средних арифметических экспериментальной и контрольной групп настолько значимы (статистически достоверны), что риск ошибки отвергнуть нулевую гипотезу и принять альтернативную не превышает одного из трех принятых уровней значимости статистического вывода:
♦ первый уровень — 5 % (в научных текстах пишут иногда р = 5 % или а < 0,05, если представлено в долях), где допускается риск ошибки в выводе в пяти случаях из ста теоретически возможных таких же экспериментов при строго случайном отборе испытуемых для каждого эксперимента;
♦ второй уровень — 1 %, т. е. соответственно допускается риск ошибиться только в одном случае из ста (а < 0,01, при тех же требованиях);
♦ третий уровень — 0,1 %, т. е. допускается риск ошибиться только в одном случае из тысячи (а < 0,001).
Последний уровень значимости предъявляет очень высокие требования к обоснованию достоверности результатов эксперимента и потому редко используется.
154
При сравнении средних арифметических экспериментальной и контрольной групп важно определить, какая средняя не только больше, но и насколько больше. Чем меньше разница между ними, тем более приемлемой окажется нулевая гипотеза об отсутствии статистически значимых (достоверных) различий. В отличие от мышления на уровне обыденного сознания, склонного воспринимать полученную в результате опыта разность средних как факт и основание для вывода, педагог-исследователь, знакомый с логикой статистического вывода, не будет торопиться в таких случаях. Он, скорее всего, сделает предположение о случайности различий, выдвинет нулевую гипотезу об отсутствии достоверных различий в результатах экспериментальной и контрольной групп и лишь после опровержения нулевой гипотезы примет альтернативную.
Таким образом, вопрос о различиях в рамках научного мышления переводится в другую плоскость. Дело не только в различиях (они почти всегда есть), а в величине этих различий и отсюда — в определении разницы и границы, после которого можно сказать: да, различия неслучайны, они статистически достоверны, а значит, испытуемые этих двух групп принадлежат после эксперимента уже не к одной (как раньше), а к двум различным генеральным совокупностям, и уровень подготовленности учащихся, потенциально принадлежащих этим совокупностям, будет существенно отличаться. Для того чтобы показать границы этих различий, используются так называемые оценки генеральных параметров. Рассмотрим на конкретном примере (табл. 6.6), как с помощью математической статистики можно опровергнуть или подтвердить нулевую гипотезу.
Допустим, необходимо определить, зависит ли эффективность групповой деятельности студентов от уровня развития межличностных отношений в их учебной группе. В качестве нулевой гипотезы выдвигается предположение, что такой зависимости не существует, а в качестве альтернативной — зависимость существует. Для этих целей сравниваются результаты эффективности деятельности в двух группах, одна из которых в этом случае выступает в качестве экспериментальной, а вторая — контрольной. Чтобы определить, является ли разность между средними значениями показателей эффективности в первой и во второй группах существенной (значимой), необходимо вычислить статистическую достоверность этой разницы. Для
155
этого можно использовать t-критерий Стъюдента. Он вычисляется по формуле
Вычислив величину ^-критерия, по специальной таблице определяют уровень статистической значимости различий между средними показателями эффективности деятельности в экспериментальной и контрольной группах. Чем выше значение ^-критерия, тем выше значимость различий.
Для этого t расчетное сравниваем с t табличным. Табличное значение выбирается с учетом выбранного уровня достоверности (р = = 0,05 или р = 0,01), а также в зависимости от числа степеней свободы, которое находится по формуле
156
Для таблицы t-критерия находим, что значение tTa6jl = 3,055 для однопроцентного уровня (р < 0,01) при 12 степенях свободы. Таким образом, величина £та6л < t асч. Следовательно, можно сделать статистически обоснованный вывод о том, что эффективность деятельности в экспериментальной группе выше, чем в контрольной, при уровне значимости 0,01 (риск ошибки составляет одна из ста теоретически возможных).
Однако педагогу-исследователю следует помнить, что существование статистической значимости разности средних значений может быть важным, но не единственным аргументом в пользу наличия или отсутствия связи (зависимости) между явлениями или переменными. Поэтому необходимо привлекать и другие аргументы количественного или содержательного обоснования возможной связи.
157