Дисперсія - це міра дисперсії, яка представляє мінливість ряду даних щодо його середнього значення. Формально він обчислюється як сума квадратних залишків, поділена на загальну кількість спостережень.
Його також можна обчислити як стандартне відхилення в квадраті. До речі, ми розуміємо залишок як різницю між значенням змінної за раз і середнім значенням усієї змінної.
Див. Усі заходи дисперсіїПерш ніж розглядати формулу дисперсії, ми повинні сказати, що дисперсія в статистиці дуже важлива. Оскільки, хоча це і проста міра, вона може надати багато інформації про конкретну змінну.
Формула для обчислення дисперсії
Одиницею вимірювання дисперсії завжди буде одиниця виміру, що відповідає даним, але в квадраті. Дисперсія завжди більша або дорівнює нулю. Оскільки залишки мають квадрат, математично неможливо, щоб дисперсія вийшла негативною. І таким чином воно не може бути менше нуля.
Де
- X: змінна, за якою слід розраховувати дисперсію
- хi: число спостереження i змінної X. я можу приймати значення від 1 до n.
- n: кількість спостережень.
- x̄: Це середнє значення змінної X.
Або те саме:
Чому залишки в квадраті?
Причина залишків у квадраті проста. Якби вони не були в квадраті, сума залишків була б нульовою. Це властивість відходів. Отже, щоб уникнути цього, як і при стандартному відхиленні, вони мають квадрат. Результат - це одиниця виміру, в якій дані вимірюються, але в квадраті.
Наприклад, якби ми мали дані про заробітну плату групи людей у євро, дані, що дають дисперсію, були б у квадратних євро. Щоб тлумачення мало сенс, ми розрахували б стандартне відхилення і передали дані в євро.
- Відхилення -> (2-3) = -1
- Відхилення -> (4-3) = 1
- Відхилення -> (2-3) = -1
- Відхилення -> (4-3) = 1
- Відхилення -> (2-3) = -1
- Відхилення -> (4-3) = 1
Якщо додати всі відхилення, результат буде нульовим.
РангУ чому різниця між дисперсією та стандартним відхиленням?
Одним із запитань, яке можна було б задати, і з поважною причиною, була б різниця між дисперсією та стандартним відхиленням. Насправді вони приходять вимірювати одне і те ж. Дисперсія - це квадратичне стандартне відхилення. Або навпаки, стандартним відхиленням є квадратний корінь дисперсії.
Стандартне відхилення зроблено, щоб мати можливість працювати в початкових одиницях виміру. Звичайно, як зазвичай, можна задатися питанням, яка користь від відхилення як поняття? Ну, хоча інтерпретація значення, яке воно повертає, не дає нам багато інформації, його розрахунок необхідний для отримання значення інших параметрів.
Для обчислення коваріації нам потрібна дисперсія, а не стандартне відхилення, для обчислення деяких економетричних матриць використовується дисперсія, а не стандартне відхилення. Це питання комфорту при роботі з даними, за якими розрахунками.
Приклад розрахунку дисперсії
Ми збираємося створити низку даних про заробітну плату. У нас п’ятеро людей, кожен із різною зарплатою:
Хуан: 1500 євро
Пепе: 1200 євро
Хосе: 1700 євро
Мігель: 1300 євро
Матео: 1800 євро
Середня зарплата, яка нам потрібна для нашого розрахунку, становить ((1500 + 1200 + 1700 + 1300 + 1800) / 5) 1500 євро.
Оскільки формула дисперсії у розбитому вигляді формулюється наступним чином:
Ми отримаємо, що він повинен бути розрахований таким чином, що:
Результат - 52 000 євро в квадраті. Важливо пам’ятати, що коли ми обчислюємо дисперсію, ми маємо одиниці виміру в квадраті. Щоб перевести його в євро, у цьому випадку нам довелося б виконати стандартне відхилення. Орієнтовний результат складе 228 євро. Це означає, що в середньому різниця між зарплатами різних людей становитиме 228 євро.