Rho Спирмена - це непараметрична міра залежності, в якій обчислюється середня ієрархія спостережень, різниці мають квадрат і враховуються у формулі.
Іншими словами, ми призначаємо рейтинг спостереженням кожної змінної та вивчаємо залежність залежності між двома заданими змінними.
Класифіковані кореляції - це непараметрична альтернатива як міра залежності між двома змінними, коли ми не можемо застосувати коефіцієнт кореляції Пірсона.
Як правило, присвоюється буква giega rho до коефіцієнта кореляції.
Оцінка rho Спірмена дається за формулою:
Процедура Ро Спирмена
0. Почнемо з вибірки п спостереження (Ai, Бi).
1. Класифікуйте спостереження за кожною змінною, коригуючи їх на зв'язки.
- Ми використовуємо функцію excel, яка класифікує для нас спостереження та автоматично їх коригує, якщо виявляє зв’язок між елементами. Ця функція називається HERARCH.MEDIA (класифікація Ai; Класифікаціяп; замовлення).
- Останній фактор функції є необов’язковим і повідомляє нам, в якому порядку ми хочемо упорядкувати спостереження. Ненульове число сортуватиме спостереження за зростанням. Наприклад, він присвоїть найменшому елементу ранг 1. Якщо ми помістимо нуль у змінну порядок, присвоїть найбільшому предмету ранг 1 (за спаданням).
Практичний приклад
- У нашому випадку ми присвоюємо змінній порядку ненульове число, щоб упорядкувати спостереження за зростанням. Тобто, присвоєння найменшому елементу змінної рангу 1.
- Перевіряємо, що загальні суми стовпців Класифікація A Y Класифікація B вони рівні між собою і зустрічаються:
У цьому випадку n = 10, оскільки в кожній змінній ми маємо 10 елементів / спостережень ДО Y B.
Загальна сума класифікації A дорівнює загальній сумі класифікації Y, і вони також відповідають наведеній вище формулі.
ДО | B | Класифікація A | Класифікація B | Квадратні різниці |
0 | 50 | 2,5 | 8,5 | 36 |
70 | -20 | 9 | 3 | 36 |
-20 | 30 | 1 | 6,5 | 30,25 |
40 | -90 | 6 | 1 | 25 |
30 | 0 | 5 | 4 | 1 |
50 | 30 | 7 | 6,5 | 0,25 |
20 | 20 | 4 | 5 | 1 |
0 | -40 | 2,5 | 2 | 0,25 |
80 | 70 | 10 | 10 | 0 |
60 | 50 | 8 | 8,5 | 0,25 |
Разом | 55 | 55 | 130 |
2. Додайте відмінності між рейтингами та обчисліть їх.
- Отримавши всі класифіковані спостереження з урахуванням зв'язків між ними, ми розраховуємо різницю у формі:
di = Ai - Бi
Визначимо (di) як різниця між класифікацією Ai і класифікація Bi.
- Отримавши різницю, ми її квадрат. Квадрати різниць застосовуються лише для позитивних значень.
Визначаємо di2 як квадратична різниця між класифікацією Ai і класифікація Bi.
У стовпці квадратичних різниць ми матимемо:
di2 = (Ai - Бi)2
3. Обчисліть rho Спирмена:
- Обчислюємо загальну суму квадратних різниць виду:
У нашому прикладі:
- Ми враховуємо результат у формулі rho Спірмена:
У нашому прикладі:
Порівняння: Пірсон проти Спірмена
Якщо ми розрахуємо коефіцієнт кореляції Пірсона з урахуванням попередніх спостережень і порівняємо його з коефіцієнтом кореляції Спірмена, отримаємо:
- Пірсон = 0,1109
- Копієносець = 0,2121
Ми бачимо, що залежність між змінними A і B залишається слабкою, навіть використовуючи Спірмена замість Пірсона.
Якби викиди мали великий вплив на результати, ми виявили б велику різницю між Пірсоном та Спірменом, і, отже, ми повинні використовувати Спірмена як міру залежності.