Назначение и содержание многомерного регрессионного анализа. Построение линейного уравнения регрессии. Многомерный регрессионный анализ (Multiple Regression) применяется для построения уравнения регрессии для параметра Y в зависимости от факторов X1Хk. Модель может быть линейной и нелинейной. Наиболее простой, содержащей только линейные эффекты факторов, является линейная модель:
, (1)
где - прогнозируемое значение выходного параметра; - свободный член; - коэффициенты регрессии; - возможные значения факторов Х1, Х2, ..., Хk; - линейные эффекты факторов.
Коэффициенты модели получают методом наименьших квадратов по исходной матрице наблюдений n×(k+l), где: n - число строк в матрице, равное числу наблюдаемых объектов, k+l - число столбцов, равное числу независимых переменных (k факторов Х1, Х2, ..., Хk) и одной зависимой переменной (моделируемый параметр Y).
Значимость коэффициентов оценивают по t-критерию Стьюдента. При построении модели в ответственных случаях, например, для прогноза параметра Y, в модели сохраняют только значимые коэффициенты с доверительной вероятностью больше или равной 0,95 или с уровнем значимости р,05. В поисковом исследовании с целью изучения характера изменения параметра Y при изменении факторов и степени влияния их на параметр, допускают сохранение в модели эффектов с коэффициентами, при уровне их значимости р≤0,30 (доверительной вероятностью равной или больше 0,70).
Стандартный алгоритм регрессионного анализа предусматривает расчет:
- числовых характеристик переменных;
- корреляционной матрицы;
- коэффициентов модели с оценками их значимости;
- результатов дисперсионного анализа модели и оценки коэффициентов множественной корреляции и детерминации, средней квадратичной ошибки прогноза параметра Y по модели;
- графика линии регрессии с указанием 95%-го доверительного интервала для прогноза значений параметра Y.
Сущность пошагового регрессионного анализа. Стандартный алгоритм многомерного регрессионного анализа обеспечивает получение коэффициентов модели для всех независимых переменных X1Хk. Исходя из уровней значимости, исследователь решает, какие коэффициенты должны быть включены в модель как значимые, достоверные. Для автоматического включения значимых эффектов в модель и исключения незначимых предлагается пошаговый регрессионный анализ в двух вариантах:
Forward – поочередное включение в модель наиболее значимых эффектов;
Backward – поочередное исключение из полной модели наименее значимых эффектов.
Отбор значимых эффектов реализуется по критерию F-Фишера.
В ответственных исследованиях для получения коэффициентов с уровнем значимости р≤0,05 задаётся значение критерия F=34. В поисковых исследованиях значение F=12 обеспечивает включение в модель коэффициентов с уровнем значимости р≤0,30.
Дисперсионный анализ и оценка эффективности модели. Дисперсионный анализ модели выполняется для оценки ее эффективности. Под эффективностью модели понимают её информативность и значимость (достоверность). Модель считают информативной, если ее коэффициент детерминации R2>0,5; значимой, достоверной при уровне значимости по F - критерию р,05 (достоверности ,95).
Достарыңызбен бөлісу: |