Теорема Гауса-Маркова - це набір припущень, які повинен виконувати оцінювач OLS (звичайні найменші квадрати), щоб вважатися ELIO (Оптимальний лінійний неупереджений оцінювач). Ітеорему Гауса-Маркова сформулювали Карл Фрідріх Гаус і Андрій Марков.
Карл Фрідеріх Гаус і Андрей Марков встановили деякі припущення, щоб оцінювач OLS міг стати ELIO.
Якщо ці 5 припущень виконуються, ми можемо ствердити, що оцінювач - це той, що має мінімальну дисперсію (найточнішу) з усіх лінійних та неупереджених оцінювачів. У випадку, якщо будь-яке з припущень перших трьох не вдається (лінійність, нульова середньо-сувора екзогенність або відсутність ідеальної мультиколінеарності), оцінювач OLS більше не є неупередженим. Якщо лише 4 або 5 дають збій (гомосцедастичність та відсутність автокореляції), оцінювач все ще є лінійним та неупередженим, але він вже не є найбільш точним. Резюмуючи, теорема Гауса-Маркова стверджує, що:
- Згідно з припущеннями 1, 2 та 3, оцінювач OLS є лінійним та неупередженим. Тепер, доки не виконуються перші три припущення, можна гарантувати, що оцінювач є неупередженим. Для того, щоб оцінювач був послідовним, ми повинні мати велику вибірку, чим більше, тим краще.
- Згідно з припущеннями 1, 2, 3, 4 та 5, оцінювач OLS є лінійним, неупередженим та оптимальним (ELIO).
Припущення теореми Гауса-Маркова
Зокрема, існує 5 припущень:
1. Лінійна модель у параметрах
Це досить гнучке припущення. Це дозволяє використовувати функції змінних, що цікавлять.
2. Нульова середня і сувора екзогенність
Це означає, що середнє значення помилки, обумовлене поясненнями, дорівнює безумовному очікуваному значенню і дорівнює нулю. Крім того, сувора екзогенність вимагає, щоб помилки моделі не корелювали з будь-якими спостереженнями.
Нульове середнє:
Сувора екзогенність:
Нульове середнє і сувора екзогенність не вдаються, якщо:
- Модель недостатньо конкретизована (наприклад, відсутність відповідних змінних).
- У змінних є помилки вимірювання (дані не переглядались).
- У часових рядах сувора екзогенність не вдається у моделях відкладеної ендогенності (хоча одночасна екзогенність може існувати) та у випадках, коли існують ефекти зворотного зв'язку.
У даних поперечного перерізу набагато легше досягти припущення про екзогенність, ніж у випадку часових рядів.
3. Відсутність точної мультиколінеарності
У вибірці жодна з пояснювальних змінних не є постійною. Точних лінійних зв’язків між пояснювальними змінними не існує. Це не виключає деякої (не досконалої) кореляції між змінними. На думку Гаусса та Маркова, коли модель має точну мультиколінеарність, це, як правило, відбувається через помилку аналітика.
4. Гомосцедастичність
Дисперсія помилки, а отже, і Y, не залежить від пояснювальних значень і, крім того, дисперсії постійної помилки. Математично це виражається як:
Ось низка даних з гомоскедастичним виглядом.
5. Відсутність автокореляції
Умови помилок двох різних спостережень, зумовлених X, не пов'язані. Якщо вибірка випадкова, автокореляції не буде.
Де я повинен мати значення, відмінне від h. Якщо вибірка випадкова, дані та помилки спостереження "i" та "h" будуть незалежними для будь-якої пари спостережень "i" та "h".