И анализ больших данных



Pdf көрінісі
бет59/65
Дата29.12.2023
өлшемі2,33 Mb.
#145048
түріУчебно-методическое пособие
1   ...   55   56   57   58   59   60   61   62   ...   65
Байланысты:
BIG дата книга

 
 
Лабораторная работа 3 
 
Тема: Использование электронных таблиц Excel 2010 для построения 
выборочных функций распределения 
 
Цель: 
с помощью электронных таблиц Excel 2010рассмотреть построения 
выборочных функций распределения
 
 
Теоретические сведения 
Рассмотренные в лабораторной работе 2 распределения вероятностей СВ 
опираются на знание закона распределения СВ. Для практических задач такое знание – 
редкость. Здесь закон распределения обычно неизвестен, или известен с точностью до 
некоторых неизвестных параметров. В частности, невозможно рассчитать точное значение 
соответствующих вероятностей, так как нельзя определить количество общих и благо-
приятных исходов. Поэтому вводится статистическое определение вероятности. По этому 
определению вероятность равна отношению числа испытаний, в которых событие 
произошло, к общему числу произведенных испытаний. Такая вероятность называется 
статистической частотой. 
Связь между эмпирической функцией распределения и функцией распределения 
(теоретической функцией распределения) такая же, как связь между частотой события и 
его вероятностью. 


69 
Для построения выборочной функции распределения весь диапазон изменения 
случайной величины X (выборки) разбивают на ряд интервалов (карманов) одинаковой 
ширины. Число интервалов обычно выбирают не менее 3 и не более 15. Затем определяют 
число значений случайной величины X, попавших в каждый интервал (абсолютная 
частота, частота интервалов).
Частота интервалов – число, показывающее сколько раз значения, относящиеся к 
каждому интервалу группировки, встречаются в выборке. Поделив эти числа на общее 
количество наблюдений (n), находят относительную частоту (частость) попадания 
случайной величины X в заданные интервалы.
По найденным относительным частотам строят гистограммы выборочных функций 
распределения. Гистограмма распределения частот – это графическое представление 
выборки, где по оси абсцисс (ОХ) отложены величины интервалов, а по оси ординат (ОУ) 
– величины частот, попадающих в данный классовый интервал. При увеличении до 
бесконечности размера выборки выборочные функции распределения превращаются в 
теоретические: гистограмма превращается в график плотности распределения. 
Накопленная частота интервалов – это число, полученное последовательным 
суммированием частот в направлении от первого интервала к последнему, до того
интервала включительно, для которого определяется накопленная частота. 
В Excel для построения выборочных функций распределения используются спе-
циальная функция ЧАСТОТА и процедура Гистограмма из пакета анализа.
Функция ЧАСТОТА (массив_данных, двоичный_массив) вычисляет частоты 
появления случайной величины в интервалах значений и выводит их как массив цифр, где
- массив_данных — это массив или ссылка на множество данных, для которых 
вычисляются частоты; 
- двоичный_массив — это массив интервалов, по которым группируются значения 
выборки. 
Процедура Гистограмма из Пакета анализа выводит результаты выборочного 
распределения в виде таблицы и графика. Параметры диалогового окна Гистограмма: 
- Входной диапазон - диапазон исследуемых данных (выборка); 
- Интервал карманов - диапазон ячеек или набор граничных значений, 
определяющих выбранные интервалы (карманы). Эти значения должны быть введены в 
возрастающем порядке. Если диапазон карманов не был введен, то набор интервалов, 
равномерно распределенных между минимальным и максимальным значениями данных, 
будет создан автоматически. 
- выходной диапазон предназначен для ввода ссылки на левую верхнюю ячейку 
выходного диапазона. 
- переключатель Интегральный процент позволяет установить режим включения в 
гистограмму графика интегральных процентов. 
- переключатель Вывод графика позволяет установить режим автоматического 
создания встроенной диаграммы на листе, содержащем выходной диапазон. 
Пример 1. Построить эмпирическое распределение веса студентов в килограммах 
для следующей выборки: 64, 57, 63, 62, 58, 61, 63, 70, 60, 61, 65, 62, 62, 40, 64, 61, 59, 59, 
63, 61. 
Решение 
В ячейку А1 введите слово Наблюдения, а в диапазон А2:А21 — значения веса 
студентов (см. рис. 1). 
В ячейку В1 введите названия интервалов Вес, кг. В диапазон В2:В8 введите 
граничные значения интервалов (40, 45, 50, 55, 60, 65, 70). 
Введите заголовки создаваемой таблицы: в ячейки С1 — Абсолютные частоты, в 
ячейки D1 — Относительные частоты, в ячейки E1 — Накопленные частоты.(см. рис. 1). 


70 
С помощью функции Частота заполните столбец абсолютных частот, для этого 
выделите блок ячеек С2:С8. С панели инструментов Стандартная вызовите Мастер 
функций (кнопка fx). В появившемся диалоговом окне выберите категорию 
Статистические и функцию ЧАСТОТА, после чего нажмите кнопку ОК. Указателем 
мыши в рабочее поле Массив_данных введите диапазон данных наблюдений (А2:А8). В 
рабочее поле Двоичный_массив мышью введите диапазон интервалов (В2:В8). Слева на 
клавиатуре последовательно нажмите комбинацию клавиш Ctrl+Shift+Enter. В столбце C 
должен появиться массив абсолютных частот (рисунок 20). 
В ячейке C9 найдите общее количество наблюдений. Активизируйте ячейку С9, на 
панели инструментов Стандартная нажмите кнопку Автосумма. Убедитесь, что диапазон 
суммирования указан правильно и нажмите клавишу Enter.
Заполните столбец относительных частот. В ячейку введите формулу для 
вычисления относительной частоты: =C2/$C$9. Нажмите клавишу Enter. Протягиванием 
(за правый нижний угол при нажатой левой кнопке мыши) скопируйте введенную 
формулу в диапазон и получите массив относительных частот. 
Заполните столбец накопленных частот. В ячейку D2 скопируйте значение от-
носительной частоты из ячейки E2. В ячейку D3 введите формулу: =E2+D3. Нажмите 
клавишу Enter. Протягиванием (за правый нижний угол при нажатой левой кнопке мыши) 
скопируйте введенную формулу в диапазон D3:D8. Получим массив накопленных частот. 
Рисунок 20 - Результат вычислений из примера 1 
Постройте диаграмму относительных и накопленных частот. Щелчком указателя 
мыши по кнопке на панели инструментов вызовите Мастер диаграмм. В появившемся 
диалоговом 
окне 
выберите 
закладку 
Нестандартные 
и 
тип 
диаграммы 
График/гистограмма. После редактирования диаграмма будет иметь такой вид, как на 
рисунок 21. 
Рисунок 21 - Диаграмма относительных и накопленных частот из примера


71 
Задания для самостоятельной работы: 
1. Для данных из примера 1 построить выборочные функции распределения, 
воспользовавшись процедурой Гистограмма из пакета Анализа. 
2. Построить выборочные функции распределения (относительные и накопленные 
частоты) для роста в см. 20 студентов: 181, 169, 178, 178, 171, 179, 172, 181, 179, 168, 174, 
167, 169, 171, 179, 181, 181, 183, 172, 176. 
3. Найдите распределение по абсолютным частотам для следующих результатов 
тестирования в баллах: 79, 85, 78, 85, 83, 81, 95, 88, 97, 85 (используйте границы 
интервалов 70, 80, 90). 
4. Рассмотрим любой из критериев оценки качеств педагога-профессионала, 
например, «успешное решение задач обучения и воспитания». Ответ на этот вопрос 
анкеты типа «да», «нет» достаточно груб. Чтобы уменьшить относительную ошибку 
такого измерения, необходимо увеличить число возможных ответов на конкретный 
критериальный вопрос. В табл. 1 представлены возможные варианты ответов. 
Обозначим этот параметр через х. Тогда в процессе ответа на вопрос величина х 
примет дискретное значение х, принадлежащее определенному интервалу значений. 
Поставим в соответствие каждому из ответов определенное числовое значение параметра 
х (таблица 6). 
Таблица 6 - Критериальный вопрос: успешное решение задач обучения и 
воспитания 
№ п/п 
Варианты ответов 
Х 

Абсолютно неуспешно 
0,1 

Неуспешно 
0,2 

Успешно в очень малой степени 
0,3 

В определенной степени успешно, но еще много недостатков 
0,4 

В среднем успешно, но недостатки имеются 
0,5 

Успешно с некоторыми оговорками 
0,6 

Успешно, но хотелось бы улучшить результат 
0,7 

Достаточно успешно 
0,8 

Очень успешно 
0,9 
10 
Абсолютно успешно 

При проведении анкетирования в каждой отдельной анкете параметр х принимает 
случайное значение, но только в пределах числового интервала от 0,1 до 1. 
Тогда в результате измерений мы получаем неранжированный ряд случайных 
значений (таблица 7).
Таблица 7 - Результаты опроса ста учителей 
0,6 
0,7 

0,6 
0,2 
0,8 
0,3 
0,5 
0,9 
0,3 
0,5 
0,1 
0,4 
0,5 
0,5 
0,4 
0,4 
0,6 
0,5 
0,4 
0,6 
0,9 
0,7 
0,9 
0,8 
0,5 
0,5 
0,6 
0,8 
0,4 
0,4 
0,4 
0,8 
0,7 
0,6 
0,6 
0,7 
0,8 
0,5 
0,6 
0,7 
0,6 
0,7 
0,3 
0,2 
0,7 
0,5 
0,3 
0,4 
0,5 
0,9 
0,7 
0,6 
0,5 
0,7 
0,6 
0,2 
0,8 
0,8 
0,3 
0,7 
0,5 
0,7 
0,6 
0,2 
0,5 
0,8 
0,3 
0,7 
0,8 
0,7 
0,6 
0,6 
0,8 
0,4 
0,6 
0,6 
0,6 
0,9 
0,7 
0,7 
0,5 
0,7 
0,6 
0,9 
0,4 
0,8 
0,7 
0,5 
0,8 
0,8 
0,9 
0,4 
0,3 
0,4 
0,6 
0,4 
0,5 
0,3 
0,5 


72 
Сгруппируйте полученную выборку, рассчитайте среднее значение выборки, 
стандартное отклонение, абсолютную и относительную частоту появления параметра, а 
также постройте график плотности вероятности f(x)=


2
)
(


Достарыңызбен бөлісу:
1   ...   55   56   57   58   59   60   61   62   ...   65




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет