И анализ больших данных



Pdf көрінісі
бет60/65
Дата29.12.2023
өлшемі2,33 Mb.
#145048
түріУчебно-методическое пособие
1   ...   57   58   59   60   61   62   63   64   65
Байланысты:
BIG дата книга

x
W
, где 
W(x) – относительная частота наступления события; 

- стандартное отклонение; 

=3,14. 
Постройте график функции f(x) и сравните его с нормальным распределением 
Гаусса.
Лабораторная работа 4 
 
Тема: Использование электронных таблиц Excel 2010 для обработки данных
 
Цель: 
с помощью электронных таблиц Excel 2010 рассмотреть обработку данных

 
Теоретические сведения 
 
В процессе обучения постоянно ощущается потребность в хорошо разработанных 
методах измерения уровня обученности в самых различных областях знаний. Известно, 
что профессиональное тестирование было начато еще в 2200 году до нашей эры, когда 
служащие Китайского императора тестировались, чтобы определить их пригодность для 
императорской службы. По некоторым оценкам в 1986 году по крайней мере 800 
профессий лицензировались в Соединенных Штатах на основании тестирования (А.А. 
Захаров, А.В. Колпаков Современные математические методы объективных 
педагогических измерений) 
Почти каждый педагог разрабатывает тестовые задания по своей дисциплине, но не 
каждый может грамотно обработать и интерпретировать результаты теста. Напротив, 
грамотное конструирование теста на основе знания теории тестирования позволит 
педагогу-исследователю создать инструмент, позволяющий провести объективное 
измерение знаний, умений и навыков по данному курсу с необходимой точностью. 
В настоящее время существуют два теоретических подхода к созданию тестов: 
классическая теория и современная теория IRT (Item Response Theory). Оба подхода 
базируются на последующей статистической обработке так называемого сырого балла 
(raw score), то есть балла, набранного в результате тестирования. Только после проведения 
многократных статистических обработок можно говорить о создании теста с устойчивыми 
параметрами качества (надежностью и валидностью).
Для обработки данных, полученных на этапе тестирования, воспользуемся пакетом 
MS Office 2010 и электронными таблицами MS Excel. 
После сбора эмпирических данных необходимо провести статистическую 
обработку, которую будем проводить на ЭВМ. Этап математико–статистической 
обработки разобьем на ряд шагов. 
Шаг 1. Формирование матрицы тестовых результатов. 
Результаты ответов учеников на задания тестов оцениваются в дихотомической 
шкале: за каждый правильный ответ учащийся получает один балл, а за неправильный 
ответ или за пропуск задания – нуль баллов (рисунок 23). 
Шаг 2. Преобразование матрицы тестовых результатов. 
На втором шаге из матрицы тестовых результатов устраняются строки и столбцы, 
состоящие только из нулей или только из единиц. В приведенном выше примере таких 


73 
столбцов нет, а строк только две. Одна из них, нулевая строка соответствует ответам 
одиннадцатого испытуемого, который не смог выполнить правильно ни одного задания в 
тесте.
Рисунок 23 - Матрица результатов тестирования 
В этом случае вывод довольно однозначен: тест непригоден для оценки знаний 
такого ученика. Для выявления его уровня знаний тест необходимо облегчить, добавив 
несколько более легких заданий, которые, скорее всего, выполнит правильно большинство 
остальных испытуемых группы. 
Столь же непригоден, но уже по другой причине, тест для оценки знаний 
двенадцатого ученика, который выполнил правильно все без исключения задания теста. 
Причина непригодности теста заключается в его излишней легкости, не позволяющий 
выявить истинный уровень подготовки двенадцатого ученика. Возможно, двенадцатый 
ученик знает много чего другого и в состоянии выполнить по контролируемым разделам 
содержания гораздо более трудные задания, которые просто не были включены в тест. 
Таким образом, на данном шаге необходимо удалить из матрицы данных 11 и 12 
строки. 
Шаг 3. Подсчет индивидуальных баллов испытуемых и количество правильных 
ответов на каждое задание теста. 
Индивидуальный балл испытуемого получается суммированием всех единиц, 
полученных им за правильное выполнение задания теста. В Excel для суммирования 
данных по строке можно воспользоваться кнопкой Автосумма 
на панели 
инструментов Стандартная. Для удобства полученные индивидуальные баллы (Хi) 
приводятся в последнем столбце матрицы результатов (рисунок 24). 
Число правильных ответов на задания теста (Yi) также получается суммированием 
единиц, но уже расположенным по столбцам .(рис. 2) 
Шаг 4. Упорядочение матрицы результатов. 
Значения индивидуальных баллов необходимо отсортировать по возрастанию, для 
этого в MS Excel
- выделим блок ячеек, содержащих номера испытуемых, матрицу результатов и 
индивидуальные баллы. Начинать выделение необходимо со столбца X (индивидуальные 
баллы). 
- на панели инструментов Стандартная нажимаем на кнопку Сортировка по 
возрастанию 
. Матрица результатов примет вид, изображенный на рисунке 25. 


74 
Рисунок 24 - 
Матрица с подсчетом итоговых сумм 
Рисунок 25 -
Упорядоченная матрица результатов 
Шаг 5. Графическое представление данных. 
Эмпирические результаты тестирования можно представить в виде полигона 
частот, гистограммы, сглаженной кривой или графика. 
Для построения кривых упорядочим результаты эксперимента и подсчитаем 
частоту получения баллов (рисунок 26 - 28). 
Рисунок 26 -
Несгруппированный ряд 
Рисунок 27 - 
Ранжированный ряд 
Рисунок 28 -
Частотное распределение 
Для расчета рейтинга (ранга) каждого учащегося по индивидуальным балам 
необходимо применить функцию РАНГ, которая возвращает ранг числа в списке чисел
Ранг числа – это его величина относительно других значений в списке. 
В MS Excel 2000 для вычисления ранга используется функция
РАНГ (число; ссылка; порядок), где 
Число – адрес на ячейку, для которой определяется ранг. 
Ссылка - ссылка на массив индивидуальных баллов (выборка). 


75 
Порядок – число, определяющее способ упорядочения. Если порядок равен 0 
(нулю), или опущен, то Excel определяет ранг числа так, как если бы ссылка была 
списком, отсортированным в порядке убывания. Если порядок – любое ненулевое число, 
то Excel определяет ранг числа так, как если бы ссылка была списком, отсортированным в 
порядке возрастания. 
Примечание. Функция РАНГ присваивает повторяющимся числам одинаковый 
ранг. При этом наличие повторяющихся чисел влияет на ранг последующих чисел. 
Например, если в списке целых чисел дважды встречается число 10, имеющее ранг 5, 
число 11 будет иметь ранг 7 (ни одно из чисел не будет иметь ранг 6). 
По частотному распределению можно построить гистограмму (рисунок 29). 
Гистограмму можно построить и по индивидуальным баллам (рисунок 30). 
1
1
0
3
1
2
0
0
2
0
0
0,5
1
1,5
2
2,5
3
3,5
1
2
3
4
5
6
7
8
9
10


Достарыңызбен бөлісу:
1   ...   57   58   59   60   61   62   63   64   65




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет