И анализ больших данных



Pdf көрінісі
бет64/65
Дата29.12.2023
өлшемі2,33 Mb.
#145048
түріУчебно-методическое пособие
1   ...   57   58   59   60   61   62   63   64   65
Байланысты:
BIG дата книга

Лабораторная работа 7 
 
Тема: Использование электронных таблиц Excel и статистического пакета 
Stadia для проведения дисперсионного анализа 
 
Цель: 
с помощью электронных таблиц Excel и статистического пакета Stadia 
рассмотреть проведения дисперсионного анализа 
Теоретические сведения 
Дисперсионный анализ предназначен для исследования задачи о действии на 
измеряемую случайную величину (отклик) одного или нескольких независимых факторов.
В MS Excel для проведения однофакторного дисперсионного анализа используется 
процедура Однофакторный дисперсионный анализ. 
Для проведения дисперсионного анализа необходимо: 
1. ввести данные в таблицу, так чтобы в каждом столбце оказались данные, 
соответствующие одному значению исследуемого фактора, а столбцы располагались в 
порядке возрастания (убывания) величины исследуемого фактора; 
2. выполнить команду Сервис > Анализ данных; 
3. в появившемся диалоговом окне Анализ данных в списке Инструменты анализа 
выбрать процедуру Однофакторный дисперсионный анализ, затем нажать кнопку ОК; 


96 
4. в появившемся диалоговом окне задать Входной интервал, то есть ввести ссылку 
на диапазон анализируемых данных, содержащий все столбцы данных.
5. в разделе Группировка переключатель установить в положение по столбцам; 
6. указать выходной интервал, то есть ввести ссылку на ячейку, с которой будут 
показаны результаты анализа. Размер выходного диапазона будет определен 
автоматически, и на экран будет выведено сообщение в случае возможного наложения 
выходного диапазона на исходные данные. Нажать кнопку ОК. 
Выходной диапазон будет включать в себя результаты дисперсионного анализа: 
средние, дисперсии, критерий Фишера и другие показатели. Влияние исследуемого 
фактора определяется по величине значимости критерия Фишера, которая находится в 
таблице Дисперсионный анализ на пересечении строки Между группами и столбца Р-
Значение. В случаях, когда Р-Значение < 0,05, критерий Фишера значим и влияние 
исследуемого фактора можно считать доказанным. 
Кроме рассмотренной процедуры однофакторного дисперсионного анализа, для 
проведения двухфакторного дисперсионного анализа в пакете анализа реализованы 
процедуры Двухфакторный дисперсионный анализ с повторениями и Двухфакторный 
дисперсионный анализ без повторений. 
Пример 1. Необходимо выявить, влияет ли расстояние от центра города на степень 
заполняемости гостиниц. Пусть введены 3 уровня расстояний от центра города: 1) до 3 км, 
2) от 3 до 5 км и 3) свыше 5 км. Данные заполняемости представлены в таблице 12. 
Решение 
Таблица 12 - Данные заполняемости 
Исследуемые данные введите в рабочую таблицу Excel по столбцам: в столбец А 
— заполняемость гостиниц в центре города, в столбец В — гостиниц, находящихся на 
расстоянии от 3 до 5 км и т. д. (диапазон А1:С6). 
Выполните команду Сервис > Анализ данных. В появившемся диалоговом окне 
Анализ данных в списке Инструменты анализа щелчком мыши выберите процедуру 
Однофакторный дисперсионный анализ. Нажмите кнопку ОК. 
В появившемся диалоговом окне Однофакторный дисперсионный анализ в поле 
Входной интервал задайте А1:С6.
В разделе Группировка переключатель установите в положение по столбцам. 
Укажите выходной диапазон Е1 и нажмите Ок. 
В результате будет получена следующая таблица рисунок 52. В таблице 
Дисперсионный анализ на пересечении строки Между группами и столбца Р-значение 
находится величина 0,0002684 <0,05, следовательно, критерий Фишера значим и влияние 
фактора расстояния от центра города на эффективность заполнения гостиниц доказана 
статистически. 
Расстояние 
Заполняемость 
До 3 км 
92 98 89 97 90 94 
От 3 до 5 км 
90 86 84 91 83 82 
Свыше 5 км 
87 79 74 85 73 77 


97 
Рисунок 52 - Результаты примера 1 
Задание для самостоятельной работы: 
Определите влияет ли фактор образования на уровень зарплаты сотрудников 
фирмы на основании следующих данных (таблица 13). 
Таблица 13 - Данные по зрплате 
Образование 
Зарплата сотрудников 
Высшее 
3200 3000 2600 2000 1900 1900 
Среднее спец. 
2600 2000 2000 1900 1800 1700 
среднее 
2000 2000 1900 1800 1700 1700 
2. Исследователь сравнивает эффективность четырех разных методик обучения 
производственным навыкам. Для этой цели из всех выпускников ПТУ выбраны четыре 
группы учащихся, обучавшиеся, соответственно четырьмя разными методами. 
Эффективность методик оценивалась по сумме обработанных учащимися деталей в 
течение одного дня (таблица 14).
Таблица 14 - Сравнение методик 
№ учащихся 

группа 

группа 

группа 

группа 

60 
75 
60 
95 

80 
66 
80 
85 

75 
85 
65 
100 

80 
80 
60 
80 

85 
70 
86 

70 
80 
75 

90 
3. Проведите дисперсионный анализ для примера 1, задания 1 и задания 2 в 
статистическом пакете Stadia (лаб. 5). Для этого выбираем процедуру В=Однофакторный 
в окне Статистические методы – Дисперсионный анализ. При запросе метода выбираем 
1=параметрический. Совпадают ли полученные значения. 


98 


Достарыңызбен бөлісу:
1   ...   57   58   59   60   61   62   63   64   65




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет