Розподіл Пуассона - це дискретний розподіл ймовірностей, який моделює частоту певних подій протягом фіксованого інтервалу часу на основі середньої частоти виникнення згаданих подій.
Іншими словами, розподіл Пуассона - це дискретний розподіл ймовірностей, який, лише знаючи події та їх середню частоту виникнення, ми можемо дізнатися їх імовірність.
Вираз
Враховуючи дискретну випадкову величину X, ми говоримо, що її частоту можна задовільно наблизити до розподілу Пуассона, так що
Розподіл Пуассона залежить лише від одного параметра mu (позначений жовтим кольором). Mu повідомляє очікувану кількість подій, які відбудуться за встановлений інтервал часу.
Функція щільності ймовірності (pdf)
Ця функція розуміється як ймовірність того, що випадкова величина X приймає конкретне значення x. Це експоненція від’ємного середнього, помножена на середнє значення, піднесене до спостереження, і все ділиться на факторіал спостереження.
Як було зазначено, щоб знати ймовірність кожного спостереження, нам доведеться підставити всі спостереження у функцію.
Розрахунок за допомогою Excel
Хоча попередня формула може здатися дуже складною, Excel вирішує наше життя, просто написавши = POISSON та вводячи необхідні дані. Таким чином ми можемо обчислити функцію щільності ймовірності.
Функція залежить від x, mu та логічного значення. Для обчислення функції щільності ймовірності ми збираємося покласти FALSE в логічне значення, таке що:
= POISSON (x, mu, FALSE).
= POISSON.DIST (x, mu, FALSE).
Обидві функції Excel рівнозначні.
Приклад Пуассона в Excel
Ми припускаємо, що хочемо покататися на лижах до грудня. Імовірність того, що гірськолижні курорти відкриються до грудня, становить 5%. Ми хочемо знати ймовірність того, що найближчі гірськолижні курорти відкриються до грудня. Зі 100 станцій, що є поруч, є лише 3 станції. Оцінки для цих 3 станцій становлять 4, 9 та 6 відповідно.
Вхідними даними, необхідними для обчислення функції ймовірності щільності Пуассона, є набір даних і mu:
- Набір даних = 100 гірськолижних курортів.
- Mu = 5% * 100 = 5 - очікувана кількість гірськолижних курортів з урахуванням набору даних.
Вручну
Excel
- Набір даних або зразок. Частина набору даних була прихована для перегляду в цілому.
- Обчислити функція щільності ймовірності Пуассона:
Клітини, позначені синім кольором, вказують на ймовірність того, що станції поблизу відкриються до грудня. Отже, найближча станція, яка, швидше за все, відкриється до грудня, - це станція 98 з рейтингом 4 та ймовірністю 17,54%.