Закономерносте й. Выводы о закономерностях, которым



бет1/2
Дата27.11.2023
өлшемі58,19 Kb.
#128952
түріЗакон
  1   2

2
Maтематическая статистика - это раздел математики, в котором

изучаются методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений с целью выявления сущест-вующих закономерностей. Выводы о закономерностях, которым под-чиняются явления, изучаемые методами математической статистики, всегда основываются на ограниченном, выборочном числе наблюдений.


Оценив неизвестные величины или зависимости между ними по дан-ным наблюдений, исследователь выдвигает ряд гипотез (предположений) о том, что рассматриваемое явление можно описать той иди иной вероятностной теоретической моделью. Далее, используя методы математической статистики, можно дать ответ на вопрос, какую из гипотез или моделей следует принять. Именно эта модель и есть закономерность изучаемого явления. Таков типичный путь исследования на основе аппарата математической статистики.
Предлагаемый курс лабораторных работ направлен на обучение студентов методам обработки статистических данных, их анализа и управления с помощью компьютера. Лабораторный практикум включает в себя лабораторные работы по основным темам, предусмотренным учебной программой по дисциплине. Для его выполнения необходимо программное обеспечение MS EXCEL.
В ходе выполнения каждой лабораторной работы студент оформляет и сдает отчет, который должен содержать: название лабораторной работы; цель работы; постановку задания; результаты решения на компьютере; анализ полученного решения, интерпретация результатов; выводы и заключения по заданию.5

ЛАБОРАТОРНАЯ РАБОТА № 1

СТАТИСТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ

Цель: Научиться основным методам обработки данных, представленных выборкой, путем построения гистограммы, определения 3
выборочного среднего, выборочной дисперсии, выборочной медианы и моды.
Вероятностная модель ставит в соответствие результатам наблюдений1,x2,...,xn

последовательность случайных величин



X1,X2,...,Xn .
Предполагается, что случайные величины
X1,X2,...,Xn
независимыи имеют одно и то же распределение с функцией распределения Fx. Полагают, что наблюдения (1) являются значениями величин (2) при осуществлении вероятностного эксперимента. Несмотря на различие объектов (1) и (2), в математической статистике принято называть и то и другое выборкой из генеральной совокупности.
Количество наблюдений n называется объемом выборки.

Произвольная случайная величина X характеризуется своей функцией распределения вероятностей Fx. Если эта функция


неизвестна, но известна выборка (1), числовые данные которой являются



n
значениями случайной величины X , то возможно построить эмпирическую функцию распределения вероятностей F x, которая
служит оценкой теоретической функции распределения вероятностей6

Fx. Если обозначить через n xчисло тех значений x1,x2,...,xn ,

которые меньше или равны x, то



n
F xn x. (3)

Если объем выборки n большой, то для представления о виде ее

распределения строится гистограмма.

Вводим в первый столбец (ячейки А1…) исходные данные. Для элементов выборки находим минимальный и максимальный элементы, которые ограничивают интервал, содержащий все элементы выборки. Для этого запишем в первую строку второго столбца (В1) слово Максимум, а во вторую строку второго столбца (В2) слово Минимум. В соседних ячейках С1 и С2 определим функции МАХ и MIN. Для этого ставим


4
курсор в С1 и вызываем мастер функций, нажав на кнопку fx , в открывшемся окне в поле «Категория» выбираем СТАТИСТИЧЕСКИЕ, и ниже ищем функцию МАКС и вызываем ее двойным щелчком по названию. В качестве аргумента функции (в графе «Число 1») обведем область данных (ячейки А1…). Поле «Число 2» оставляем пустым. Нажимаем «ОК». Ставим курсор в ячейку С2 и аналогично вводим функцию МИН. В некоторых случаях для удобства обработки интервал расширяется, но не существенно.
Следующим шагом является разбиение построенного интервала на k=1,72n 1/3 более мелких интервалов. Дальше в этом интервале рассматриваются не пj различных случайных величин а пj одинаковых величин имеющих значение полусуммы граничных точек интервала j nj=(хjлев +xjправ)/2
Если разбиение построено удачно, то гистограмма будет напоминать график плотности (если она существует) распределения вероятностей случайной величины, значениями которой являются элементы выборки. Если разбиение мелкое, то гистограмма не дает представления о плотности распределения вероятностей из-за случайных флуктуаций. Если разбиение крупное, то гистограмма также не дает представления о плотности распределения вероятностей из-за того, что теряется много информации.
Чтобы построить интервалы разбиения (группировки), нужно от максимального значения выборки вычесть минимальное значение и полученный результат разделить на число интервалов. Полученное значение называется шагом разбиения. Чтобы получить верхние границы интервалов группировки, нужно последовательно прибавлять шаг разбиения, начиная от минимального значения выборки.
В ячейки D1… вводим верхние границы интервалов группировки. Для вычисления частот ni используется функция ЧАСТОТА, находящаяся в категории СТАТИСТИЧЕСКИЕ. Введем ее в ячейку Е1. В строке
5
«Массив данных» введем диапазон выборки (ячейки А1…). В строке «Массив интервалов» введем диапазон верхних границ интервалов группировки (ячейки D1…). Результат функции является массивом и выводится в ячейках Е1... Для полного вывода (не только первого числа в Е1) нужно выделить ячейки Е1…, обведя их мышью, и нажать F2, а далее одновременно CTRL+SHIFT+ENTER. Результат – частоты ni , которые показывают, сколько элементов выборки попало в каждый из интервалов разбиения.Для построения гистограммы в EXCEL 2003 нужно из меню ВСТАВКА выбрать ДИАГРАММА (или нажать на соответствующий значок МАСТЕР ДИАГРАММ на основной панели), при этом курсор должен стоять в свободной ячейке. Далее выбрать тип диаграммы: ГИСТОГРАММА, вид по выбору, нажать ДАЛЕЕ, в строке ДИАПАЗОН обвести частоты Е1.., перейти на вкладку РЯД, в строке ПОДПИСИ ОСИ Х ввести интервалы в ячейках D1…, нажать ДАЛЕЕ ввести название ГИСТОГРАММА, подписи осей: ось Х - ИНТЕРВАЛЫ и ось Y -ЧАСТОТА, нажать ГОТОВО. Для создания полигона перейти на пустую ячейку и сделать то же самое, только вместо типа диаграммы ГИСТОГРАММА, выбрать ГРАФИК. При использовании EXCEL 2007 для создания диаграммы необходимо выделить блок данных, на основании которых строится диаграмма. В выделяемый блок данных включить не только числовые данные, но и заголовки строк (столбцов), в которых они расположены. Заголовки будут использованы в качестве подписей по осям (меток) и для формирования условных обозначений (легенды). При выделении блоков с данными для построения диаграмм необходимо соблюдать два правила:
1. Выделенный фрагмент должен состоять из равновеликих столбцов. 2. В выделенном фрагменте не должно быть объединенных ячеек.
Для построения гистограммы необходимо перейти на вкладку ВСТАВКА, открыть список ГИСТОГРАММА выбрать нужную гистограмму. Гистограмма строится сразу. Иногда необходимо выделить
6
построенную диаграмму и провести изменение размера шрифта или растянуть диаграмму для лучшего чтения данных в поле диаграммы. Если вызвать контекстное меню в поле всей диаграммы, то меню предлагает три отдельных шага в построении диаграммы (в предыдущих версиях было четыре шага): Изменить тип диаграммы; выбрать данные; переместить диаграмму.
В мастере функций fx существуют специальные функции, позволяющие вычислять выборочные характеристики.
Функция СРЗНАЧ вычисляет выборочное среднее (оценку



n
теоретического математического ожидания) x (1/n)xi .

Функция ДИСП вычисляет выборочную дисперсию (оценку




n

2

2
теоретической дисперсии)

Функция СТАНДОТКЛОН вычисляет квадратный корень из

выборочной дисперсии.


~
Функция МЕДИАНА вычисляет выборочную медиану (оценку медианы) заданной выборки. Медианой случайной величины называется то ее значение, которое делит распределение на две равновероятные половины. В качестве выборочной медианы m в выборке объема 2n 1 берут значение



Достарыңызбен бөлісу:
  1   2




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет