Лінійна модель ймовірності

Модель лінійної ймовірності - це бінарна модель вибору. У цьому умовне очікування залежної змінної є лінійною функцією, тобто зв'язок залежної змінної з пояснювальною (-ими) змінною (-ами) є постійною.

Щоб побачити це по-іншому, лінійна модель ймовірності - це модель, де ми маємо залежну змінну та незалежну змінну (и), помножену на постійний коефіцієнт (и).

Слід зазначити, що лінійна модель ймовірності є бінарною моделлю вибору, тобто де залежна змінна може приймати два значення. Ці значення дорівнюють 1 або 0, що вказує на успіх або невдачу відповідно.

Модель лінійної ймовірності виражається наступним чином:

E (Y | X = x) = Pr (Y = 1 | X = x) = p (x) = β0 + β1x

У наведеному рівнянні умовне сподівання Y, задане X, інтерпретується як рівне β0 + β1x.

У цьому випадку ми приймаємо умовне сподівання, оскільки нам цікаво знати ймовірність того, що людина приймає рішення з огляду на їх характеристики, наприклад (або іншу незалежну змінну можна взяти за посилання).

Недоліки лінійної моделі ймовірностей

Деякі недоліки лінійної моделі ймовірності полягають у наступному:

  • Лінійна модель ймовірності може демонструвати гетероскедастичність. А саме дисперсія помилок неоднакова у всіх зроблених спостереженнях. У цьому випадку використовуються стандартні помилки.
  • Не можна припустити, що помилки зазвичай розподіляються.
  • Залежна змінна може приймати лише два значення.
  • Передбачається, що незалежні та залежні змінні мають лінійну залежність, тобто швидкість змін завжди однакова. Однак може бути точнішим побудувати модель, де швидкість змін зростає, коли Y досягає вищого значення, а навпаки - коли Y зменшується.

Враховуючи ці недоліки, існують моделі logit та probit.

Приклад лінійної моделі ймовірностей

Лінійна модель ймовірності може бути побудована, наприклад, де залежною змінною є те, чи має людина в даний час офіційну роботу, яку вона займає рік чи довше. Незалежними змінними можуть бути рівень навчання або освітній рівень, стать та вік.

У наведеному прикладі залежною змінною буде 1 або 0, але її потрібно інтерпретувати якісно, ​​незалежно від її числового значення. Таким чином, 1 означає, що особа має офіційну роботу, яка зберігається більше 1 року, а 0 - це ситуація, в якій цього не відбувається.