Категорична змінна - що це таке, визначення та поняття

Зміст:

Категорична змінна - що це таке, визначення та поняття
Категорична змінна - що це таке, визначення та поняття
Anonim

Категорична змінна - це така, що дозволяє класифікувати ряд даних за допомогою фіксованих значень, пов'язаних з певною якістю або категорією.

Категорична змінна, на відміну від основних або неперервних змінних (які дозволяють чисельні обчислення), класифікує осіб або випадки. Зазвичай вони приймають значення, представлені цілими числами, наприклад одиницею або нулем, але це саме такі подання.

У прикладі ми побачимо це більш докладно.

Різниця між категоріальною та неперервною змінною

Існують деякі відмінності між категоріальною змінною та неперервною або основною змінною, які слід знати. Давайте подивимося найбільш актуальне.

  • По-перше, категоріальна змінна використовується для групування, а неперервна змінна для підрахунку. Іншими словами, перший дозволяє формувати категорії із низкою даних. Наприклад, стать або кількість дітей. Другий дає нам числову інформацію. Наприклад, вік.
  • Основна змінна дозволяє чисельні обчислення, інші - ні. Таким чином, в першому ми можемо знати засоби або відхилення, тоді як в інших лише деякі дані, такі як режим або відсоток категорій.
  • Категоричні дуже корисні для знання якісної інформації, тобто певної якості даних. Безперервні дають нам кількісні дані, тобто величини та значення, представлені числами.

Статистичні методи для категоріальних змінних

Далі, давайте розглянемо статистичні прийоми, які найбільш часто використовуються в категоріальних змінних, порівнюючи їх із методами безперервних або основних змінних.

  • Описова статистика: Для цього типу змінних аналіз, як правило, базується на гістограмах та відсотках, серед іншого. Кардинали дозволяють застосовувати методи аналізу для обчислення статистичних даних про позиції, таких як квантилі, або статистики дисперсії, таких як дисперсії.
  • Контраст гіпотез: Категорично, результати можуть бути екстрапольовані за допомогою непараметричних тестів гіпотез. З іншого боку, безперервні використовують параметричні контрасти, про які також можна зробити висновок.
  • Прийоми регресії: У цьому випадку для першого, серед іншого, використовується логістична регресія або подібне. Для іншого типу змінних найбільш часто застосовується техніка - лінійна регресія.

Приклад категоріальної змінної

На завершення розглянемо дуже поширений приклад у маркетингу. Уявімо, що ми хочемо продати товар і нам цікаво знати сімейний стан.

Для цього ми призначимо 1 неодруженому, 2 одруженому, 3 розведеному, 4 партнеру та 5 іншим.

Давайте подивимося зображення, а потім прокоментуємо його:

У ньому ми бачимо, що найбільший відсоток осіб - одинокі, одружені та розлучені, а два інших варіанти становлять лише 5%.

Як бачимо, категоричні змінні корисні для групування. Стовпчаста діаграма дозволяє нам краще спостерігати ці відсотки, оскільки легше порівняти розмір стовпчиків.