Помилка типу I - що це таке, визначення та поняття
Помилка типу 1 у статистиці визначається як відхилення нульової гіпотези, коли вона насправді відповідає дійсності. Помилка типу 1 також відома як помилково позитивна або помилка типу альфа.
Помилка типу 1 - це, по суті, заперечення чогось, коли це насправді є правдою. Розглянемо, наприклад, ситуацію тестування, чи збільшує маркетингова кампанія в соціальних мережах продажі морозива для компанії протягом літнього тижня. Гіпотезами були б такі:
H0: Через літню кампанію продажі не збільшуються
H1: Збільшення продажів за рахунок маркетингової кампанії
Після оцінки відвідуваності веб-сайту компанії та сторінок, відвіданих після кампанії, виявляється таке:
- Збільшення, хоча трафіку та відвідувань на 50%.
- Зростання продажів морозива на 200%.
З огляду на ці результати, можна зробити висновок, що рекламна кампанія була плідною і мала ефект збільшення збільшення продажів. Однак давайте подумаємо, що того тижня була спека, яка підняла температури вище 40 градусів.
Знаючи останнє, нам довелося б врахувати фактор високої температури як причину збільшення продажів. Якщо ми не врахуємо цього, ми могли б відхилити нашу нульову гіпотезу, коли вона відповідає дійсності, тобто ми думали б, що наша кампанія мала шалений успіх, коли насправді причиною збільшення продажів була сильна спека. Якби ми дійшли такого висновку, ми б відкинули нульову гіпотезу, коли вона насправді відповідає дійсності, і, отже, допустили помилку типу 1.
Причини помилки типу 1
Помилка типу 1 пов’язана зі значимістю контрасту або альфа-коду, з похибкою оцінки коефіцієнтів і може виникнути через 2 типових порушення вихідних припущень регресії. Це:
- Умовна гетероскедастичність.
- Послідовна кореляція.
Регресія, яка представляла будь-яке з попередніх порушень, занизила б похибку коефіцієнтів. Якщо це станеться, наша оцінка статистики t буде більшою за фактичну статистику t. Ці більші значення статистики t збільшують ймовірність того, що значення потрапить у зону відхилення.
Давайте уявимо 2 ситуації.
Ситуація 1 (неправильна оцінка помилки)
- Значимість: 5%
- Обсяг вибірки: 300 чоловік.
- Критичне значення: 1,96
- B1: 1,5
- Похибка оцінки коефіцієнта: 0,5
Т = 1,5 / 0,5 = 3
Таким чином, значення потрапляло б у зону відхилення, і ми відкидали б нульову гіпотезу.
Ситуація 2 (правильна оцінка помилки)
- Значимість: 5%
- Обсяг вибірки: 300 чоловік.
- Критичне значення: 1,96
- B1: 1,5
- Похибка оцінки коефіцієнта: 1
Т = 1,5 / 1 = 1,5
Таким чином, значення падало б у зону невідхилення, і ми не відкидали б гіпотезу.
Виходячи з попередніх прикладів, ситуація 1, в якій помилка занижена, призвела б до відхилення нульової гіпотези, коли насправді вона відповідає дійсності, оскільки, як ми бачимо у ситуації 2 з правильно оціненою помилкою, ми не відкидали б гіпотезу бути правдою.