Проба Колмогорова - Смирнов (K-S)

Тест Колмогорова-Смірнова (K-S) - це непараметричний тест, який має на меті визначити, чи відповідає частота двох різних наборів даних однаковому розподілу навколо їх середнього значення.

Іншими словами, тест Колмогорова-Смірнова (K-S) - це тест, який пристосовується до форми даних і використовується для перевірки того, чи дві різні вибірки мають однаковий розподіл.

Чому це непараметричний тест?

Краса “непараметричної” характеристики полягає в тому, що вона відповідає даним і, отже, розподілам, які можуть слідувати за частотою даних. Крім того, ця функція позбавляє нас від необхідності припускати апріорі за яким розподілом слід зразок.

Важливість тесту K-S

Скільки разів нам давали дві вибірки та обчислювали коефіцієнт кореляції Пірсона, не думаючи двічі? Іншими словами, якщо ми хочемо бачити лінійну залежність між двома наборами даних, було б справедливо розрахувати кореляцію, так?

Цей висновок був би вірним, якщо розподіли двох зразків слідують нормальному розподілу. Коефіцієнт кореляції припускає, що розподіли нормальні, якщо пропустити це припущення, результат коефіцієнта кореляції помилковий. Для тестів гіпотез та довірчих інтервалів ми також припускаємо, що популяція розподіляється за допомогою нормального розподілу.

Як і всі тести гіпотез, що включають статистику, важливо мати великий обсяг даних, щоб мати статистично значущі результати. Ми можемо помилково відкинути нульову гіпотезу, оскільки вибірка мала. Крім того, також важливо, щоб у цій вибірці були деякі крайні випадки (викиди, англійською мовою) для забезпечення послідовності результатів тесту.

Процедура випробування

Процедура наступних кроків.

Гіпотеза

Першим кроком буде перевірка, чи мають обидва зразки однаковий розподіл. Для цього ми проводимо перевірку гіпотези, припускаючи, що обидві вибірки мають однаковий розподіл проти альтернативної гіпотези, що вони різні.

Статистичні

Ми працюємо з кумулятивними функціями розподілу двох зразків, F₁(x) та F₂(х):

Без паніки! Ми спокійно аналізуємо наведену вище формулу:

Важливою частиною формули є знак різниці (-). Ми шукаємо вертикальні відмінності у розподілах. Отже, ми віднімемо обидві кумулятивні функції розподілу.
оператор "макс". Ми зацікавлені знайти найбільшу або максимальну різницю, щоб побачити, наскільки різними можуть бути два розподіли.
абсолютна величина. Ми використовуємо абсолютне значення, щоб порядок операторів не міняв результат. Іншими словами, неважливо, який F (x) має негативний знак:

Критичне значення

Для великих зразків існує наближення до критичного значення для K-S, яке залежить від рівня значущості (%):

Де₁ та н₂ - розмір вибірки для вибірки F₁(x) та F₂(x) відповідно.

Деякі розраховані критичні значення:

Правило відхилення

Додаток

Дуже часто ми хочемо перевірити, чи два розподіли досить відрізняються один від одного, коли ми хочемо створити сценарії прогнозування (ми працюємо з двома вибірками) або коли ми хочемо оцінити, який розподіл найкраще відповідає даним (ми працюємо лише з одним зразком).

Проба Колмогорова - Смирнов (K-S)

Чому це непараметричний тест?

Важливість тесту K-S

Процедура випробування

Гіпотеза

Статистичні

Критичне значення

Правило відхилення

Додаток

Популярні Пости

Сонячна енергія - що це таке, визначення та поняття

Давня епоха - що це таке, визначення та поняття

Приріст капіталу (економіка) - що це таке, визначення та поняття

Відсоток - що це таке, визначення та поняття

Кращі Статті

Материнська компанія - що це таке, визначення та поняття

Гіперінфляція - що це таке, визначення та поняття

Дерево рішень - що це таке, визначення та поняття

Які найкращі потокові платформи в Іспанії?

Виробництво ланцюгів - що це таке, визначення та поняття

Популярні за місяць

План Маршалла - що це таке, визначення та значення

Чи відновлюється економіка?

Якими були економічні наслідки грипу 1918 року?

Окружність - що це таке, визначення та поняття

Правильний багатогранник - що це таке, визначення та поняття

Відсоток - що це таке, визначення та поняття

Хімічна енергія - що це таке, визначення та поняття

Навколишнє середовище - що це таке, визначення та поняття

Біомаса - що це таке, визначення та поняття

Аналіз постачальників - що це таке, визначення та поняття

Диференційована сегментація - що це таке, визначення та поняття

Бюрократична школа управління

Що вигадали китайці?