Квантиль - це та точка, яка ділить функцію розподілу випадкової величини на регулярні інтервали.
Тому відокремлення даних від розподілу є не що інше, як статистична техніка. Звичайно, треба виконати, щоб групи були рівними. З цієї причини, як ми побачимо пізніше, існують різні типи квантилів, залежно від кількості розділів, які вони роблять.
Вони надзвичайно корисні для багатьох практичних застосувань, на прикладі ми покажемо один із них.
Квантильна форма розрахунку
Кванти можна розрахувати з параметричної та непараметричної точки зору. Давайте розглянемо як більш детально, так і так звану "квантильну функцію".
- Параметричний: Вони використовуються у розподілах, форму яких ми знаємо. Тобто розподіл буде нормальним, рівномірним, експоненціальним тощо. Таким чином, передбачається, що він відомий, а також його основні параметри (середнє арифметичне та дисперсія).
- Непараметричний: Він підходить для невеликих зразків, де важко дізнатися його точну форму, а тому ми не знаємо його функції розподілу. Цей метод забезпечує значення, подібні до попереднього, коли зразок збільшується, і, отже, використання обох байдуже.
- Квантильна функція: Ми стикаємось з імовірнісною формою розрахунку. Завдання полягає в обчисленні значення, яке має певну ймовірність функції розподілу. Ми не будемо вдаватися до математичних питань, які ускладнюють поняття.
Найчастіші квантилі
Ми збираємось показати, які квантилі найчастіше використовуються в статистиці. Більшість із них зазвичай використовують для детального аналізу розподілу даних. Крім того, ще одне із його використання полягає у розділенні даних на групи, маючи можливість вибрати найвищу або найнижчу. У прикладі ми побачимо це більш докладно.
- Квартильний: Розділіть значення на чотири рівні групи, і є три квартилі. Це найчастіший. Квартиль один (Q1) є найнижчими даними, а квартиль три (Q3) - найвищою. З іншого боку, квартиль два (Q2) відповідає медіані (Me), яка є статистичною статистикою, яка ділить розподіл даних навпіл. Значення квантилів становили б 0,25 (Q1), 0,5 (Q2) та 0,75 (Q3).
- Квінтил: Подібно до попереднього, він рідше зустрічається і ділить дані на п’ять рівних частин. Тому існує чотири квінтилі. Квантильні значення в цьому випадку становили б 0,20, 0,40, 0,60, 0,80.
- Дециль: У цьому випадку вони розділені на десять частин і, отже, є дев'ять децилів. Знову ж таки, це теж не надто часто. Їх значення становитимуть від 0,1 до 0,9.
- Перцентилі: Ми стикаємось із варіантом, коли розподіл ділиться на сто рівних частин. Це може зацікавити дуже великі вибірки. Їх значення коливаються від 0,01 до 0,99.
Квантильний приклад
Давайте розглянемо приклад, в якому ми маємо низку даних про доходи жителів певного муніципалітету. Ми розрахували три найбільш репрезентативні квартилі та три децилі. Ми включаємо використані формули, враховуючи, що для децилів ми використовуємо еквівалент у процентилях. Пам'ятайте, що дані у Q2 та D5 еквівалентні медіані.
Ми можемо спостерігати, що дохід осіб, які становлять 25% найменш сприятливих (І квартал), становить 2900. Щодо дециля, дохід 10% (D1) осіб, які отримують найменше, становить 2800. Те саме трактується з начальством, але навпаки. 25% (Q3), які заробляють найбільше, отримують дохід 4100, а 10% - 4800. Отже, квантиль відображає відповідну інформацію, щоб дізнатися більше про змінну.