Це непараметрична міра залежності, яка ідентифікує конкордантну та дискордантну пари двох змінних. Після ідентифікації підраховуються підсумки та складається коефіцієнт.
Класифіковані кореляції є непараметричною альтернативою як міра залежності між двома змінними, коли ми не можемо застосувати коефіцієнт кореляції Пірсона.
Іншими словами, ми призначаємо рейтинг спостереженням кожної змінної та вивчаємо залежність залежності між двома заданими змінними. Існує два способи обчислення тау Кендалла; ми обираємо обчислювати залежність залежності, як тільки впорядковано спостереження кожної змінної. У нашому прикладі ми побачимо, що ми відсортували рейтинги у стовпці X у порядку зростання.
Математично,
Визначаємо:
C.п = загальна кількість відповідних пар.
NCп = загальна кількість несуперечливих (розбіжних) пар.
Процедура та практичний приклад
Щоб отримати Тау Кендалла, ми повинні спочатку знати, як ідентифікувати узгоджувальну та розбіжну пари двох змінних.
Ми будемо використовувати переваги лижників. У цьому прикладі ми припускаємо, що хочемо оцінити, класифікують лижники свої переваги щодо гірських лиж або скандинавських лиж в однаковому порядку на станції i. Їх рейтинги можуть коливатися від 1 (дуже бажано) до 7 (дуже мало переважно).
Наше запитання полягало б у тому: чи існує залежність між уподобаннями гірськолижників та скандинавів на цих гірськолижних курортах?
Визначаємо:
X = рейтинг лижників з гірських лиж на станції i.
Y = оцінка лижників для скандинавських лиж на станції i.
C = узгоджені пари.
NC = невідповідні / несумісні пари.
Іi = гірськолижний курорт i.
Процес
- Почнемо з вибірки n = 7 спостереження на гірськолижному курорті. Кожен рядок таблиці - класифікації, дані лижниками. Кожна пара станцій може бути узгодженою або розбіжною. У стовпцях C та NC ми підраховуємо пари лише в одному напрямку. Наприклад, пари AB і BA зараховуються як одинарні пари, щоб уникнути повторень.
Отримані спостереження:
Гірськолижний курорт (i) | X | Z |
ДО | 1 | 1 |
B | 2 | 3 |
C. | 3 | 4 |
D | 4 | 2 |
І | 5 | 7 |
F | 6 | 6 |
G | 7 | 5 |
- Ми відсортували елементи стовпця X у порядку зростання, щоб мати можливість порівняти їх з елементами стовпця Z
- Знайдемо конкордантні пари та дискордантні пари.
Гірськолижний курорт (i) | X | Z | C. | NC | |
ДО | 1 | 1 | 6 | 0 | |
B | 2 | 3 | 5 | 0 | |
C. | 3 | 4 | 5 | 1 | |
D | 4 | 2 | 4 | 0 | |
І | 5 | 7 | 4 | 1 | |
F | 6 | 6 | 4 | 1 | |
G | 7 | 5 | 43 | 3 | Разом |
- Спочатку ми розглядаємо стовпець Z, оскільки стовпець X вже відсортований за зростанням. Отже, усі класифікації у колонці Z, які не є зростаючими, будуть суперечливими парами станцій.
- Коли ми шукаємо пари станцій (узгоджені та не узгоджені), ми завжди матимемо останній рядок спостережень, оскільки ми шукаємо пари (набори з двох спостережень).
- Усі, що знаходяться нижче еталонної класифікації, будуть суперечливими парами. У першому випадку обидва лижники встановлюють, що еталонна класифікація дорівнює 1. Усі класифікації нижче 1 будуть парами, що відповідають А. Загалом у нас є 7 станцій для класифікації. Отже, буде 6 конкордантних пар A. Оскільки у нас немає несуперечливих пар, пов’язаних з A, ми поставимо нуль.
Прочитайте другу частину Тау Кендалла (II)