Рівні значущості є доповненням довірчого інтервалу розподілу і використовуються для перевірки нульової гіпотези (H0) у тесті статистичного висновку.
Іншими словами, рівні значущості - це ймовірності, які ми залишаємо за межами довірчого інтервалу розподілу, і допомагають нам визначити, чи є статистика тесту в зоні відхилення чи ні.
Зв'язок між рівнем значущості та рівнем довіри
Звичайно, ми всі чули, як хтось запитував, яке значення ми повинні призначити альфа-розподілу або з яким рівнем впевненості обчислюємо інтервал, математично, (1-альфа). Відповідь зазвичай завжди становить 1%, 5% або 10% для альфа-версії або 99%, 95% та 90% для рівня впевненості.
Важливо чітко усвідомлювати наступне:
- 1%, 5%, 10% = альфа => Рівні значущості.
- 99%, 95%, 90% = (1-альфа) => Довірчий інтервал.
Довірчі інтервали та рівні значущості доповнюють один одного, оскільки сума обох - це площа функції щільності. Тоді,
Ми вже знаємо, що площа функції щільності дорівнює 1. Математично ми можемо розв’язати цей інтеграл:
Представлення рівня значущості
У цьому випадку розподіл Стьюдента t з 16 ступенями свободи був використаний, щоб показати, які області функції належать до рівнів значущості. Відсотки (2,5%, 2,5% та 95%) відповідають площі під функцією щільності. Оскільки цей розподіл має два хвости, рівень значимості ділиться навпіл, отже, 2,5% + 2,5% = 5%. Критичне значення цього розподілу з 16 ступенями свободи та 5% як рівень значущості становить 2,11991 у кожному хвості.
2,5% + 2,5% + 95% = 1%
Універсальний
Ми позначаємо рівні значимості як універсальні, оскільки ці рівні відомі та використовуються у всіх статистичних тестах. Дуже незвично знайти рівень значущості 20% або 35%, якщо це не є явною умовою тесту.
Це правда, що рівні 1% і 5% популярніші за рівень 10%, але це з міркувань точності. Краще дати результат 1 із 100 разів (1/100 = 0,01 = 1%) або 5 із 100 разів (5/100 = 0,05 = 5%), ніж 10 із 100 разів (10/100 = 0,1 = 10%), так?
Також рівні значущості називаються процентилем, наприклад, 1% процентилем або 5% процентилем. Ця номенклатура широко використовується для розрахунку метрики значення ризику (VaR).
Довільні та не свавільні
Рівні значущості можуть бути довільними та не довільними. Довільними є вибрані нами значення апріорі (до) знання особливостей експерименту. У цьому випадку це було б до обчислення статистики тесту. Недовільними є ті, які отримані в результаті експерименту. У цьому випадку значення р, оскільки воно залежить від значення, прийнятого тестовою статистикою. І те, і інше залежить від розподілу, за яким слідують дані.