[Оставьте этот титульный лист для дисциплины, закрепленной за одной кафедрой]



бет9/10
Дата07.04.2023
өлшемі102,64 Kb.
#80384
түріПрограмма дисциплины
1   2   3   4   5   6   7   8   9   10
Хрупкое содержимое

Доставка в черте города

Класс посылки

Температура на улице (в градусах по Цельсию)

Время доставки (в минутах)

1

1

3

10

61

0

0

2

12

54

1

0

2

5

41

0

1

1

7

13

0

0

1

8

15

1

1

3

10

55

0

1

3

13

71

0

0

2

11

53

0

0

3

5

67

1

1

2

3

51

1

0

3

5

23

1

1

3

2

120

Хрупкое содержимое - это переменная, которая принимает значение «1», если посылка содержит хрупкие предметы и «0» в противном случае.


Доставка в черте города - «1», если доставка осуществляется в черте города, «0» - в противном случае.
Класс посылки - чем ниже значение, тем более важная посылка с более приоритетной доставкой.
Температура на улице - средняя температура воздуха днём во время доставки посылки.
Время доставки - время, прошедшее с момента получения посылки до момента её доставки.
Исследователь считает, что между некоторыми переменными может существовать связь, поэтому ему нужно рассчитать коэффициенты, которые покажут наличие либо отсутствие этих связей. Определите, какие коэффициенты нужно использовать для расчёта силы связи между разными переменными. Проведите расчёты коэффициентов. Имеется ли какая-нибудь зависимость между «хрупкостью содержимого» и «доставкой в черте города»? Если есть, то какая? Есть ли связь между «Классом посылки» и «временем доставки»? Если есть, то какая именно? Связаны ли между собой «температура на улице» и «Время доставки»?


Задание 3. Аналитик попытался дать прогноз по продажам автомобилей своей компании на год вперёд на основе исторических данных. Для этого он использовал процедуру ретропрогноза, построил несколько моделей и выбрал из них две наилучшие. В вашем распоряжении имеются прогнозы по этим двум моделям, а так же ряд фактических значений, которые аналитик сохранил для сравнения точности моделей (см. таблицу ниже).



Месяц

Факт

Модель 1

Модель 2

Январь 2012

6002.7

6459.8

6408.9

Февраль 2012

6370.5

6340.4

6202.8

Март 2012

7664.1

7352.9

7236.4

Апрель 2012

6969.6

7346.4

7241.8

Май 2012

6963.9

7191.6

7522.7

Июнь 2012

7576.8

7350.0

8012.3

Июль 2012

6618.6

6893.6

7114.9

Август 2012

7473.6

7118.6

7867.3

Сентябрь 2012

7668.0

7598.0

8111.4

Октябрь 2012

7725.0

7727.7

8321.6

Ноябрь 2012

7223.1

7092.9

7066.8

Декабрь 2012

6461.4

6768.1

6398.4

На основе данных таблицы постройте линейные графики и сравните точность прогнозов по этим двум моделям. Какие особенности можно выделить в том, как каждая из моделей прогнозирует динамику продаж?


Рассчитайте необходимые коэффициенты для того, чтобы получить наиболее полную информацию о том, насколько точный каждая из моделей в среднем даёт прогноз.
Какой из моделей стоит отдать предпочтение и почему?


Задание 4. По 15 наблюдениям о стоимости чипсов в Санкт-Петербурге студент рассчитал среднюю величину и простую (не исправленную) дисперсию, которые получились соответственно 48,5 рублей и 225.
Рассчитайте исправленную дисперсию для этой ситуации. Рассчитайте дисперсию средней величины. Проверьте гипотезу о том, что средняя стоимость чипсов в генеральной совокупности равна 50. Проверьте гипотезу о том, что средняя стоимость чипсов в генеральной совокупности равна 45. Противоречат ли результаты проверки данной гипотезы результатам проверки в п.3?
На основе t-статистики Стьюдента постройте 90% доверительный интервал для средней величины.
Проверьте гипотезу о том, что дисперсия средней величины равна 10.
Студент так же собрал данные по стоимости чипсов в Москве. По 13 наблюдениям средняя величина составила 53 рубля, а дисперсия - 144. Проверьте гипотезу о том, что средняя стоимость чипсов В Санкт-Петербурге и Москве одинакова.


Задание 5. Студент решил собирать данные о стоимости своих обедов по дням и количестве пар в день (см. Данные таблицы).



Затраты на обед в столовой (в руб.)

150

120

125

130

150

145

135

120

100

150

Количество пар в день

5

2

2

2

4

3

3

2

1

4

По этим данным рассчитайте значение коэффициента корреляции. О чём говорит полученное значение?


Постройте точечную диаграмму зависимости стоимости обеда от количества пар.
Постройте модель линейной парной регрессии зависимости стоимости обеда от количества пар в день. Нанесите расчётные значения на точечную диаграмму из п.2.
Как вы считаете, насколько хорошо линейная модель описывает эту зависимость? Проведите расчёты, которые подкрепляли бы ваш вывод.
Студент решил, что, возможно, зависимость может носить нелинейный характер. Он решил построить степенную модель вида: . Рассчитайте коэффициенты этой модели и нанесите расчётные значения на график.
Проведите корректировку модели так, чтобы избежать систематического завышения (чтобы сумма ошибок была равна нулю).
Оцените точность второй модели. Проведите расчёты, которые помогли бы вам это сделать.
Сравните первую модель со второй моделью. Какой из них вы бы отдали предпочтение и почему?


Задание 6. Студент продолжает проводить исследование по стоимости обедов. Он не любит гречневую кашу, поэтому, когда в столовой не остаётся ничего другого в качестве гарнира, он не берёт гарнир вообще. В этот раз он решил зафиксировать такие ситуации в качестве фиктивных переменных. Кроме того, он подумал, что температура на улице может влиять на затраты на обед, поэтому зафиксировал и эти данные. Все полученные данные он свёл в следующую таблицу:



Затраты на обед в столовой (в руб.)

150

120

125

130

150

145

135

120

100

150

Количество пар в день

5

2

2

2

4

3

3

2

1

4

Есть только гречневая каша

0

1

1

0

0

0

0

0

1

0

Температура на улице, в градусах по Цельсию

15

13

14

10

14

13

12

9

11

15

Оцените наличие возможной мультиколлинеарности в данных путём построения матрицы корреляций и расчёта коэффициентов множественной корреляции. Есть ли мультиколлинеарность в данных? Чем она может быть вызвана? Нужно ли и можно ли её устранить?


Постройте матрицу точечных диаграмм. Попытайтесь определить, каким может быть влияние предложенных переменных на затраты на обед.
На основе предыдущих пунктов попробуйте оценить, с какими проблемами вы могли бы столкнуться при построении линейной регрессии. Как можно было бы их решить?
Постройте простую линейную модель множественной регрессии, объясняющую влияние указанных переменных на затраты на обед.
Рассчитайте значимость коэффициентов полученной модели. Действительно ли наличие гречневой каши существенно влияет на затраты на обед студента?
Используя принцип синтеза однофакторных моделей в многофакторную, постройте модель множественной регрессии по своим данным.


Задание 7. Работник магазина «Двушечка», занимающегося продажей настольных ламп, решил спрогнозировать продажи ламп на основе их характеристик. Он считает, что цвет и форма лампы могут влиять на её продажи. Для того чтобы проверить эту гипотезу и суметь спрогнозировать объём продаж новой партии красных ламп на длинных ножках, он разбил все лампы на несколько категорий и собрал данные за несколько дней (см. таблицу ниже).



Форма лампы

Цвет лампы

Стоимость лампы

Количество проданных ламп

Приплюснутая

Красная

470

456

На длинной ножке

Красная

620

548

Приплюснутая

Чёрная

470

206

Вытянутая

Красная

350

361

Вытянутая

Чёрная

330

200

Приплюснутая

Красная

470

423

На длинной ножке

Чёрная

600

295

Приплюснутая

Красная

470

433

Вытянутая

Чёрная

330

232

Приплюснутая

Чёрная

470

257

На длинной ножке

Чёрная

600

290

Вытянутая

Красная

350

369

Приплюснутая

Чёрная

470

226

На длинной ножке

Красная

620

522

На длинной ножке

Красная

620

511

Приплюснутая

Чёрная

470

197

Вытянутая

Чёрная

330

220

Вытянутая

Чёрная

330

250

Вытянутая

Красная

350

310

Приплюснутая

Чёрная

470

217

На длинной ножке

Красная

620

542

Вытянутая

Красная

350

351

Приплюснутая

Чёрная

470

262

Приплюснутая

Красная

470

438

На основе данных по форме и цвету ламп создайте группы фиктивных переменных. Проанализируйте, какие лампы продаются чаще. Может ли существовать какая-то связь между цветом и формой лампы? Если да, то обоснуйте эту связь.


Постройте простую модель парной регрессии зависимости количества проданных ламп от их стоимости. Нанесите фактические и расчётные значения по количеству продаж на точечный график «Стоимость — количество». Проанализируйте полученный график.
Постройте модель множественной регрессии с фиктивными переменными, отвечающими за цвет ламп. Постройте точечный график. Проанализируйте полученный результат: лучше ли модель аппроксимирует ряд по сравнению с предыдущей моделью? Почему?
Постройте 2 модели: для чёрных и для красных ламп. Сравните эти модели. Какими преимуществами и недостатками, по вашему, они обладают по сравнению с первой моделью?
Выполните то же самое, в этот раз используя фиктивные переменные для формы ламп.
Постройте 3 модели для разных форм ламп. Сравните эти модели с общей моделью.
Постройте модель на основе всех фиктивных переменных. Сравните её точность с точностью предыдущих моделей.
Какой бы из всех построенных моделей вы отдали предпочтение и почему?


Для различных задач практикума следует работать с рядами из базы M3, которую можно скачать с сайта Международного Института Прогнозистов:
(http://forecasters.org/resources/time-series-data/m3-competition/).


Задание 8. Обратимся к ряду №658 (общая стоимость активов предприятия на конце квартала). Для того чтобы посмотреть описания ряда нужно в командной строке набрать:
Постройте по ряду №658 простой линейный график. Что можно сказать о динамике общей стоимости активов предприятия?
Для более полной информации рассмотрите коррелограммы исходного ряда данных. Дают ли вам какую-нибудь информацию эти коррелограммы? Какой вывод можно сделать на основе них?
Постройте гистограмму и ящичковую диаграмму для этого ряда. Что можно сказать о распределении стоимости активов? Есть ли среди изучаемых величин выбросы?
Сгладьте ряд разными скользящими средними. Постройте линейные графики по полученным значениям. Что можно сказать о складывающихся тенденциях в ряду данных? Как вы считаете, какая математическая модель могла бы дать наиболее точный прогноз из всех, рассмотренных в данной главе?
Попробуйте выполнить по моделям прогноз на 8 наблюдений вперёд.
Оцените точность полученных прогнозов с помощью любого известного вам коэффициента. Какая модель оказалась точней? Как вы считаете, почему?


Задание 9. Перейдём к рассмотрению ряда №2558. Это финансовый ряд по погашениям кредитов.
Как вы считаете, есть ли в собранных данных сезонность? Почему? Как вы это выяснили?
Постройте по данным модель Naïve (если в данных есть сезонность, то сезонную). Дайте по ней прогноз на 1,5 год вперёд. Как вы считаете, насколько точным будет прогноз по модели и почему?


Задание 10. Откройте ряд №645 из базы M3. Изучите его.
Как вы считаете, есть ли в этом ряде какие-либо тенденции к росту или снижению?
Используя MS Excel, постройте несколько моделей простого экспоненциального сглаживания с разными методами задания стартового значения. Дайте прогнозы по полученным моделям на 6 лет вперёд.
Постройте модель Брауна в R с расширенным интервалом для постоянной сглаживания. Дайте прогноз на 6 лет вперёд по полученной модели.
Отличаются ли прогнозы по этим моделям? Как вы считаете, почему?
Оцените точность полученных прогнозов. Какая из моделей оказалась наиболее точной?


Задание 11. Проведите анализ ряда №2712.
Постройте линейный график и коррелограммы исходного ряда. Как вы считаете, стационарен ли представленный ряд?
Проведите тесты ADF и KPSS для ряда №2712 вначале по вторым разностям, потом по первым, потом по исходному ряду. Каков порядок стационарности ряда d?
Изучите коррелограммы ряда в разностях выбранного порядка в п.2. Есть ли в ряде в разностях какие-либо значимые коэффициенты автокорреляции и частной автокорреляции? Какой порядок модели ARIMA(p,d,q) соответствуют эти значения?
Постройте модель ARIMA(p,d,q) порядка, выбранного в п.3.
Изучите коррелограмму остатков полученной модели. Есть ли ещё какие-то неучтённые элементы в модели? Если есть, добавьте их в модель — вернитесь к п.4.
Постройте гистограмму по остаткам финальной модели ARIMA. Проведите тест на соответствие распределения остатков нормальному (например, тест Шапиро-Уилка). Можно ли считать остатки по полученной модели распределёнными нормально?
Дайте прогноз по итоговой модели ARIMA на 18 наблюдений вперёд.
Постройте модель экспоненциального сглаживания (на основе автоматического выбора порядка модели) для этого же ряда, дайте по ней прогноз на 18 наблюдений вперёд.


Задание 12. Изучите ряд №2796.
Есть ли в нём сезонность? Если есть, то каков лаг сезонности и каким может быть характер сезонности? Как вы это выяснили?
Постройте коррелограмму по исходному ряду и по рядам в первых и вторых разностях. Что можно сказать по полученным графикам?
Определите порядок модели ARIMA(p,d,q) на основе тестов на стационарность и коррелограмм.
Дайте прогноз по итоговой модели на 18 наблюдений вперёд.


Задание 13. Компания по производству мороженого, работающая с 2006 года собрала месячные данные о продажах мороженого «Самый-Самый Сладкий Рожок» за период с 2009 по 2012. Аналитик компании для того, чтобы спрогнозировать продажи, решил построить регрессионную модель. Считая, что на продажи мороженого (Sales, тыс. упаковок) могут влиять такие факторы, как средняя месячная температура воздуха (Temperature, градусов по Цельсию), количество осадков (Rain, в мм.), количество праздничных и выходных дней (Holidays, шт. в мес.), затраты на рекламу (Ads, тыс. руб.) и цена мороженого (Price, руб.), он собрал данные и свёл их в таблицу ниже:





Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   10




©emirsaba.org 2024
әкімшілігінің қараңыз

    Басты бет