Квартильне відхилення - що це таке, визначення та поняття

Зміст:

Anonim

Квартильне відхилення - це статистична міра дисперсії, яка повертає центральне значення міжквартильного діапазону і використовується в косих наборах даних.

Іншими словами, квартільне відхилення полягає в обчисленні медіани міжквартильного діапазону (IQR) і використовується в наборах даних з досить кількома екстремальними значеннями.

Скорочене відхилення квартиля - DQ.

Міжквартильний ареал

Міжквартильний діапазон - це міра розпорошення набору даних, який зазвичай використовується в графічному графіку. Іншими словами, міжквартильний діапазон - це різниця між передостаннім та першим квартилями розподілу, що використовується в графічному графіку.

IQR = Q3 - Q1

Перевага використання міжквартильного діапазону полягає в тому, що можна розрахувати квартильне відхилення (DQ), що є дуже адекватним показником дисперсії, коли ми маємо необ'єктивні набори даних.

Квартильна формула відхилення

Квартильне відхилення обчислюється як ділення міжквартильного діапазону на 2.

DQ = (Q3 - Q1) / 2 = RIC / 2

Оскільки ми розглядаємо лише розподіл між третім і першим квартилями, ми ігноруємо всі дані поза цим діапазоном. І тому всі цінності близькі до екстремальних. Отже, якщо розділити інтерквартильний діапазон на два, ми отримаємо медіанне значення дисперсії.

Приклад відхилення квартиля

Ми припускаємо, що хочемо розрахувати міжквартильний діапазон та квартільне відхилення кількості велосипедистів, які проїжджають наш будинок протягом року.

  1. Спочатку ми підраховуємо велосипедистів і збираємо інформацію в таблиці.
  1. По-друге, ми обчислюємо перший і третій квартилі, щоб отримати інтерквартильний діапазон.

Q3 = 550

Q1 = 200

IQR = Q3 - Q1 = 550-200 = 350

  1. По-третє, ми обчислюємо дисперсію квартиля, просто розділивши міжквартильний діапазон на два.

DQ = (Q3 - Q1) / 2 = IQR / 2 = 350/2 = 175

Квартильний спред для цього набору даних становить 175. Це число є центральним значенням міжквартильного діапазону.

Важливо зазначити, що дані за липень є надзвичайними даними, оскільки вони в кілька разів перевищують усі інші дані. Отже, можна сказати, що цей набір даних є упередженим щодо цього місяця. Завдяки «незнанню» розподілу квартилів щодо екстремальних даних, результат цього заходу дуже схожий на той, якби в липні циркулювало лише 600 велосипедистів. Якби в липні було лише 600 велосипедистів, розподіл квартилів становив би 162,5, дуже близько до 175, враховуючи, що кількість велосипедистів цього місяця в 10 разів менше.