Параметрические критерии
Группа статистических критериев, которые включают в расчет параметры вероятностного распределения признака (средние и дисперсии).
t-критерий Стьюдента
Критерий Фишера
Критерий отношения правдоподобия
Критерий Романовского.
Прежде чем приступать к выбору статистического критерия, нужно определиться с тем, от чего зависит применение тех или иных статистических методов. Для вариационных рядов, которые имеют нормальное распределение, мы рассчитывали определенные параметры, с помощью которых можно описать вариационный ряд. Для нормального распределения это – средняя величина и стандартное отклонение. В случае распределения, отличного от нормального, используются медиана и интерквартильный интервал, с помощью которых можно было описать большую часть данных. До того, как выбирать тот или иной статистический критерий исследователь прежде всего должен определиться, какие именно задачи будут решаться, и какие методы (статистические тесты) для этого будут подбираться.
В случае выбора статистического критерия для сравнения количественных данных нужно учитывать распределение признака: является ли оно нормальным или отличным от нормального. В первом случае, как и при описании вариационного ряда, мы будет использовать параметры распределения, отсюда и название этой группы методов: параметрические методы, в случае отличного от нормального распределения следует использовать непараметрические методы.
Методы и материалы
В данной работе был проведен анализ измеренного одномерного ряда, а именно интенсивность пакетов протокола MPEG. В результате анализа одномерный ряд показывает совокупность пакетов за каждой промежуток времени (в секундах). Согласно рисунку 1, количество точек равна 18000. График иллюстрирует интенсивность прохождения пакета за определенный промежуток времени, где по вертикали отображены количество пакетов, поступивших за 5 часов, а по горизонтали - время (в секундах).
Рисунок 1 - Временной ряд
Как видно, из графика полученные данные временного ряда иллюстрирует неравномерность интенсивности, разброс уровня данных и другие характеристики.
Для того чтобы спрогнозировать исследуемый сетевой трафик необходимо проверить его, используя параметрические тесты, который включает себя нормальный закон распределения проверяя его с помощью QQ plot теста.
Использования QQ plot теста необходимо для сравнения идеального нормального распределения с исследуемым распределением данных временного ряда на рисунке 2.
Рисунок 2 - Проверка нормальности распределения данных с помощью QQ plot теста
Согласно результату, из рисунка 2 можно заметить, что распределение временного ряда не соответствует нормальному закону распределения. Это связано с тем, что данное распределение не похожа на колокообразную форму кривой, которая характерно для нормального закона распределения.
Рассмотрим распределение исследуемого ряда по закону Пуассона. Распределение Пуассона определяется согласно по формуле:
где
Рисунок 3 - Полигон эмпирических частот и вероятность для распределения Пуассона
На рисунке 3,4 видно, что функция распределения интенсивности пакетов протокола MPEG не распределен по закону Пуассона и не удовлетворяет условиям нормального закона распределения [2-5].
Рисунок 4 – Выходные данные программы
В случае если исходный ряд не соответствует нормальному закону распределения, необходимо проверить данный ряд такими критериями непараметрическими теста такие как критерий Колмогорова – Смирнова, Дарбина, Дэвида-Хартли-Пирсона, Андерсона-Дарлинга и др. Согласно рисунке 5, выведены результаты временного ряда по проверке на нормальность распределения, используя условия различных критерий.
Рисунок 5 - Выходные данные проверки временного ряда на нормальность
В результате данные временного ряда демонстрирует его отклонение от нормального закона распределения.
К числовым характеристикам формы частотных распределений относятся: асимметрия и эксцесс.
Асимметрия Ax показывает степень отклонения распределения от симметричного, который характерен для нормальности распределения и рассчитывается по формуле:
и принимает значения от -3 до +3.
При Ax=0 распределение симметрично, при Ax<0 – левосторонняя асимметрия, при Ax>0 – распределение правосторонней асимметрии.
Эксцесс Ex или Куртозис показывает степень островершинности кривой распределения. Данная характеристика определяется по формуле:
и принимает значения от -3 до +3.
При Ex=0 распределение является нормальным, при Ex<0 – плосковершинным, при Ex>0 – островершинным распределением.
Рисунок 6 - Выходные данные асимметрии и куртозиса
Коэффициенты асимметрии и эксцесса, полученные с использованием программ Attestat на рисунке 5 и Matlab на рисунке 6, Excel на рисунке 6, совпадают и отличаются на незначительные доли. Ax=0,88>0 – распределение правосторонней асимметрии. Куртозис Ех=0,69>0. Данные значения демонстрируют несоответствие исследуемого ряда нормальному закону распределения.
Необходимо исследовать ряд на случайность [6] с помощью VRatio test в Matlab на рисунке 7. Тест отношения дисперсии Variance Ratio test for Random Walk оценивает нулевую гипотезу о том, что одномерный временной ряд является случайным блужданием.
Нулевая модель Y(t) = c + y(t–1) + e(t), где c — константа дрейфа (случайный процесс), e(t) — некоррелированные инновации с нулевым средним значением.
Рисунок 7 - Выходные данные проверки временного ряда на случайность
Согласно результатам, видно, что исследуемый ряд имеет случайный блуждающий характер.
0>0>
Достарыңызбен бөлісу: |