Модель AR (1) - це авторегресивна модель, яка побудована виключно на затримці.
Іншими словами, авторегресія першого порядку, AR (1), регресує авторегресію протягом певного періоду часу.
Рекомендовані статті: Авторегресивна модель та натуральні логарифми.
Формула AR (1)
Хоча позначення можуть відрізнятися від одного автора до іншого, загальним способом представлення AR (1) буде такий:
Тобто, згідно з моделлю AR (1), змінна y в момент часу t дорівнює константі (c), плюс змінна на (t-1), помножена на коефіцієнт, плюс похибка. Слід зазначити, що константа 'c' може бути додатним, від'ємним чи нульовим числом.
Щодо значення тета, тобто коефіцієнта, помноженого на y (t-1), може приймати різні значення. Однак ми можемо приблизно узагальнити це у двох:
Тета більше або дорівнює 1
| Тета | менше або дорівнює 1:
Розрахунок сподівання та дисперсії процесу
Практичний приклад
Ми припускаємо, що хочемо вивчити ціну на пропуски в цьому сезоні 2019 (t) за допомогою авторегресивної моделі порядку 1 (AR (1)). Тобто, ми збираємось повернутися на один період назад (t-1) у залежній змінній forfaits, щоб мати можливість зробити авторегресію. Іншими словами, давайте зробимо регресію на лижну путівкут про лижні перепусткиt-1.
Модель буде такою:
Сенс авторегресії полягає в тому, що регресія виконується за тією самою змінною, але через різний проміжок часу (t-1 і t).
Ми використовуємо логарифми, оскільки змінні виражаються в грошових одиницях. Зокрема, ми використовуємо натуральні логарифми, оскільки їх основою є число e, яке використовується для капіталізації майбутнього доходу.
У нас є ціни на пропуски з 1995 по 2018 рік:
Рік | Гірськолижні абонементи (€) | Рік | Лижні абонементи (€) |
1995 | 32 | 2007 | 88 |
1996 | 44 | 2008 | 40 |
1997 | 50 | 2009 | 68 |
1998 | 55 | 2010 | 63 |
1999 | 40 | 2011 | 69 |
2000 | 32 | 2012 | 72 |
2001 | 34 | 2013 | 75 |
2002 | 60 | 2014 | 71 |
2003 | 63 | 2015 | 73 |
2004 | 64 | 2016 | 63 |
2005 | 78 | 2017 | 67 |
2006 | 80 | 2018 | 68 |
2019 | ? |
Процес
На основі даних з 1995 по 2018 рр. Ми обчислюємо натуральні логарифми лижні абонементиза кожен рік:
Рік | Гірськолижні абонементи (€) | ln_t | ln_t-1 | Рік | Гірськолижні абонементи (€) | ln_t | ln_t-1 |
1995 | 32 | 3,4657 | 2007 | 88 | 4,4773 | 4,3820 | |
1996 | 44 | 3,7842 | 3,4657 | 2008 | 40 | 3,6889 | 4,4773 |
1997 | 50 | 3,9120 | 3,7842 | 2009 | 68 | 4,2195 | 3,6889 |
1998 | 55 | 4,0073 | 3,9120 | 2010 | 63 | 4,1431 | 4,2195 |
1999 | 40 | 3,6889 | 4,0073 | 2011 | 69 | 4,2341 | 4,1431 |
2000 | 32 | 3,4657 | 3,6889 | 2012 | 72 | 4,2767 | 4,2341 |
2001 | 34 | 3,5264 | 3,4657 | 2013 | 75 | 4,3175 | 4,2767 |
2002 | 60 | 4,0943 | 3,5264 | 2014 | 71 | 4,2627 | 4,3175 |
2003 | 63 | 4,1431 | 4,0943 | 2015 | 73 | 4,2905 | 4,2627 |
2004 | 64 | 4,1589 | 4,1431 | 2016 | 63 | 4,1431 | 4,2905 |
2005 | 78 | 4,3567 | 4,1589 | 2017 | 67 | 4,2047 | 4,1431 |
2006 | 80 | 4,3820 | 4,3567 | 2018 | 68 | 4,2195 | 4,2047 |
2019 | ? | ? | 4,2195 |
Отже, щоб зробити регресію, ми використовуємо значення ln_t як залежну змінну, а значення ln_t-1 як незалежну змінну. Штриховані значення виходять за межі регресії.
У Excel: = LINEST (ln_t; ln_t-1; true; true)
Виберіть стільки стовпців, скільки регресорів, і 5 рядків, поставте формулу в першу комірку та CTRL + ENTER.
Отримуємо коефіцієнти регресії:
У цьому випадку знак регресора позитивний. Отже, підвищення ціни на 1% лижні абонементи у попередньому сезоні (t-1) це призвело до зростання ціни на 0,53% лижні абонементи на цей сезон (т). Значення в дужках нижче коефіцієнтів є стандартними помилками оцінок.
Підставляємо:
лижні абонементит= лижні абонементи2019
лижні абонементиt-1= лижні абонементи2018= 4,2195 (номер напівжирним шрифтом у таблиці вище).
Тоді,
Рік | Лижні абонементи (€) | Рік | Лижні абонементи (€) |
1995 | 32 | 2007 | 88 |
1996 | 44 | 2008 | 40 |
1997 | 50 | 2009 | 68 |
1998 | 55 | 2010 | 63 |
1999 | 40 | 2011 | 69 |
2000 | 32 | 2012 | 72 |
2001 | 34 | 2013 | 75 |
2002 | 60 | 2014 | 71 |
2003 | 63 | 2015 | 73 |
2004 | 64 | 2016 | 63 |
2005 | 78 | 2017 | 67 |
2006 | 80 | 2018 | 68 |
2019 | 65 |