Гетеросцедастичність - що це таке, визначення та поняття

Зміст:

Anonim

У статистиці гетеросцедастичність - це коли помилки не є постійними протягом усієї вибірки. Цей термін суперечить гомосцедастичності.

Іншими словами, у моделях лінійної регресії сказано, що існує гетеросцедастичність, коли дисперсія помилок неоднакова у всіх зроблених спостереженнях. Таким чином, одна з основних вимог гіпотез лінійних моделей не виконується.

Слово гетероскедастичність можна розбити на дві частини, гетеро (різну) та цедастичність (дисперсність). Таким чином, якщо ми об’єднаємо ці два слова, адаптовані з грецької, ми отримаємо щось на зразок іншої дисперсії.

Коваріація

Математичне зображення гетероскедастичності

В математиці та економетриці гетероскедастичність представлена ​​так ↓

Попередня формула читається таким чином, що → дисперсія помилки у спостереженні «i», зумовленому X, (пояснювальна змінна) дорівнює дисперсії того самого спостереження. Математично вона представлена ​​дисперсійно-коваріаційною матрицею помилок, в якій основна діагональ представляє різні дисперсії для кожного спостереження або моменту (i).

На відміну від гомосцедастичності, дисперсії різні, тому ми зазначаємо їх у нижньому індексі. Якби це було те саме, ми б прямо поставили символ сигми в квадрат (дисперсія).

Гетеросцедастичність також має місце в тих зразках, де її елементами є значення, додані до окремих даних.

Наочним прикладом гетероскедастичності може бути такий:

Наслідки гетероскедастичності

Наслідки, які виникають внаслідок невиконання гіпотез гетероскедастичності в результатах на CME (оцінка найменших квадратів):

  • Існують помилки в розрахунках оцінювача дисперсійної та коваріаційної матриці оцінювачів найменших квадратів.
  • Ефективність зазвичай втрачається на оцінювачі з найменшим квадратом.

Загалом, крім вищезазначеного, оцінки найменших квадратів все ще є неупередженими, хоча вони вже не є ефективними. Тобто оцінювачі більше не матимуть мінімальної дисперсії.

Різниця між гомосцедастичністю та гетероскедастичністю

Гетероскедастичність відрізняється від гомосцедастичності тим, що в останньому дисперсія помилок пояснювальних змінних є постійною протягом усіх спостережень. На відміну від гетероскедастичності, в гомосцедастичних статистичних моделях значення однієї змінної може передбачати іншу, якщо модель є неупередженою. Тому помилки є загальними і постійними протягом усього дослідження.

Основними ситуаціями, в яких виникають гетероскедастичні порушення, є аналіз із даними поперечного перерізу, коли вибрані елементи, будь то компанії, приватні особи чи економічні елементи, не мають однорідної поведінки серед них.