Аналіз дисперсії - що це таке, визначення та поняття

Дисперсійний аналіз або ANOVA (дисперсійний аналіз) - це багатовимірні методи аналізу залежності, що використовуються для визначення того, чи є суттєві відмінності середніх показників трьох або більше груп населення.

Отже, за допомогою цього аналізу ми з’ясуємо, чи існують відмінності між певними групами, коли ми модифікуємо одну або кілька характеристик. Щоб дізнатись, ми використовуємо значення середнього значення даних.

Його використання дуже часто використовується в таких галузях, як економіка чи медицина.

Попередні припущення дисперсійного аналізу

Існує ряд передумов для проведення ANOVA, які слід знати. Це важливо для того, щоб результати були адекватними.

  • По-перше, популяція повинна дотримуватися нормального розподілу. Тому ми маємо справу з типом параметричного контрасту, оскільки параметри сукупності середнього та стандартного відхилення відомі.
  • Крім того, використовувані зразки повинні бути незалежними один від одного. Це означає, що модифікація одного з них не повинна впливати на цінність інших.
  • З іншого боку, дисперсії досліджуваних популяцій повинні бути однаковими. Це називається гомосцедастичністю.

Класифікація аналізу дисперсійних моделей

Для аналізу дисперсійних моделей можна використовувати три класифікації, показані нижче:

  • Модель фіксованих ефектів: Населення є нормальним і відрізняється лише значенням відповідних засобів.
  • Модель випадкових ефектів: У цьому випадку дані мають ієрархію, і різниця в популяції залежить від цього.
  • Модель змішаних ефектів: Ми зіткнулися б із моделлю, яка є сумішшю попередніх двох.

Приклад ANOVA: важливі поняття

Існують математичні рівняння певної складності для виконання ANOVA. Однак на Economy-Wiki.com ми обираємо просту економію, і, отже, користуючись перевагами технологій, ми збираємось показати, як це можна зробити в електронній таблиці.

Уявімо, що ми хочемо знати, чи існують суттєві відмінності між читачами Economy-Wiki.com, засновані на спорідненості їх ступеня з економікою.

Попередження: Дані, якими ми будемо користуватися, є фіктивними.

Ми повинні перейти до Дані, Аналіз даних, і ми виберемо аналіз дисперсії фактора.

Ранг був би матрицею трьох груп. Можливо, буде цікавіше включити заголовки і дати бажане форматування. У нашому випадку з логотипом та синім кольором.

Ми бачимо, що існують такі поняття, як ступінь свободи та ймовірність чи значимість. Перший розраховується автоматично і являє собою кількість груп мінус одиниця. Другий говорить нам, чи суттєві відмінності чи ні.

Зазвичай ви починаєте з прийнятого рівня довіри. В економічній науці це зазвичай становить 95% (0,95), що пов'язано зі значимістю 0,05 (1-0,095). Таким чином, якщо ця ймовірність або значення p нижче прийнятої значущості, відмінності є значними.

У цьому випадку здається, що ступінь не впливає на кількість читачів (значимість> 0,05). Отже, аналіз дисперсії, схоже, вказує на те, що Economy-Wiki.com цікавить усіх, а не лише спеціалізованих читачів. Звичайно, це вигадані дані чи ні?