Модель лінійної ймовірності - це бінарна модель вибору. У цьому умовне очікування залежної змінної є лінійною функцією, тобто зв'язок залежної змінної з пояснювальною (-ими) змінною (-ами) є постійною.
Щоб побачити це по-іншому, лінійна модель ймовірності - це модель, де ми маємо залежну змінну та незалежну змінну (и), помножену на постійний коефіцієнт (и).
Слід зазначити, що лінійна модель ймовірності є бінарною моделлю вибору, тобто де залежна змінна може приймати два значення. Ці значення дорівнюють 1 або 0, що вказує на успіх або невдачу відповідно.
Модель лінійної ймовірності виражається наступним чином:
E (Y | X = x) = Pr (Y = 1 | X = x) = p (x) = β0 + β1x
У наведеному рівнянні умовне сподівання Y, задане X, інтерпретується як рівне β0 + β1x.
У цьому випадку ми приймаємо умовне сподівання, оскільки нам цікаво знати ймовірність того, що людина приймає рішення з огляду на їх характеристики, наприклад (або іншу незалежну змінну можна взяти за посилання).
Недоліки лінійної моделі ймовірностей
Деякі недоліки лінійної моделі ймовірності полягають у наступному:
- Лінійна модель ймовірності може демонструвати гетероскедастичність. А саме дисперсія помилок неоднакова у всіх зроблених спостереженнях. У цьому випадку використовуються стандартні помилки.
- Не можна припустити, що помилки зазвичай розподіляються.
- Залежна змінна може приймати лише два значення.
- Передбачається, що незалежні та залежні змінні мають лінійну залежність, тобто швидкість змін завжди однакова. Однак може бути точнішим побудувати модель, де швидкість змін зростає, коли Y досягає вищого значення, а навпаки - коли Y зменшується.
Враховуючи ці недоліки, існують моделі logit та probit.
Приклад лінійної моделі ймовірностей
Лінійна модель ймовірності може бути побудована, наприклад, де залежною змінною є те, чи має людина в даний час офіційну роботу, яку вона займає рік чи довше. Незалежними змінними можуть бути рівень навчання або освітній рівень, стать та вік.
У наведеному прикладі залежною змінною буде 1 або 0, але її потрібно інтерпретувати якісно, незалежно від її числового значення. Таким чином, 1 означає, що особа має офіційну роботу, яка зберігається більше 1 року, а 0 - це ситуація, в якій цього не відбувається.