Це непараметрична міра залежності, яка ідентифікує конкордантну та дискордантну пари двох змінних. Після ідентифікації підраховуються підсумки та складається коефіцієнт.
Іншими словами, ми призначаємо рейтинг спостереженням кожної змінної та вивчаємо залежність залежності між двома заданими змінними.
Існує два способи обчислення тау Кендалла; ми обираємо обчислювати залежність залежності, як тільки впорядковано спостереження кожної змінної. У нашому прикладі ми побачимо, що ми сортуємо рейтинги у стовпці X у порядку зростання.
Класифіковані кореляції є непараметричною альтернативою як міра залежності між двома змінними, коли ми не можемо застосувати коефіцієнт кореляції Пірсона.
Ось результати, на які ми посилалися в першій статті -> Тау Кендалла (I):
Гірськолижний курорт (i) | X | Z | C. | NC | |
ДО | 1 | 1 | 6 | 0 | |
B | 2 | 3 | 5 | 0 | |
C. | 3 | 4 | 5 | 1 | |
D | 4 | 2 | 4 | 0 | |
І | 5 | 7 | 4 | 1 | |
F | 6 | 6 | 4 | 1 | |
G | 7 | 5 | 43 | 3 | ВСЬОГО |
- Пара BC-CB є суперечливою парою. Вводимо 1 у стовпці NC і заморожуємо лічильник в останньому положенні, поки знову не знайдемо відповідну пару. У цьому випадку ми заморозили кількість відповідних пар на 5 до станції D. Станція D може утворити лише 4 відповідних пари: AD-DA, DE-ED, DF-FD, DG-GD.
Ще однією суперечливою парою буде EF-FE:
- Пара EF-FE є суперечливою парою. Ми пишемо 1 у стовпці NC і продовжуємо перетягувати число 4 збіжних пар, які можна утворити. Парами відповідних станцій E будуть: EA-AE, EB-BE, EC-CE, ED-DE, оскільки EF-FE є суперечливим.
- Пара FG-GF є суперечливою парою. Ми пишемо 1 у стовпці NC і продовжуємо перетягувати число 4 збіжних пар, які можна утворити. Конкордантні пари станції F s (ми не змінювали замість 4. Конкордантні пари, які ми могли показати раніше (ми не змінювались, будуть: FA-AF, FB-BF, FC-CF, FD-DF тому що FG-GF нервує.
Обчислюємо тау Кендалла
У тау Кендалла немає секрету, крім того, що він є часткою збіжних і суперечливих пар вибірки спостережень.
Інтерпретація
Наше початкове запитання було: чи існує залежність залежності між уподобаннями гірськолижників та скандинавів на цих гірськолижних курортах?
У цьому випадку ми маємо залежність між двома змінними 0,8695. Результат дуже близький до верхньої межі. Цей результат говорить нам, що гірськолижники (X) та скандинави (Z) класифікували курорти з подібними класифікаціями.
Без необхідності робити будь-який тип обчислення, ми можемо побачити, що перші станції (A, B, C) отримують найкращі оцінки з двох груп. Іншими словами, рейтинги лижників йдуть в одному напрямку.
Порівняння: Пірсон - Кендалл
Якщо ми розрахуємо коефіцієнт кореляції Пірсона з урахуванням попередніх спостережень і порівняємо його з Тау Кендалла, то отримаємо:
У цьому випадку Тау Кендалла говорить нам, що існує більш сильна залежність залежності між змінними X і Z порівняно з коефіцієнтом кореляції Пірсона: 0,8695> 0,75.
Якби викиди мали великий вплив на результати, ми виявили б велику різницю між Пірсоном та Спірменом, і, отже, ми повинні використовувати Спірмена як міру залежності.