Дискримінантний аналіз - що це таке, визначення та поняття

Зміст:

Anonim

Лінійний дискримінантний аналіз (LDA) - це статистична техніка, яка створює функцію, здатну класифікувати явища, беручи до уваги ряд дискримінаційних змінних та ймовірність належності.

Тому ми маємо справу з типом статистичної процедури, яка прагне групуватися на основі певної подібності. Таким чином, це дозволяє кількісно визначити ймовірність приналежності до тієї чи іншої групи. Ці групи відомі апріорі, на відміну від кластерного аналізу.

Математична модель дискримінантного аналізу

Давайте подивимось, як би виглядала математична модель дискримінантного аналізу.

Це дуже просто, оскільки воно базується на системі лінійних рівнянь. Звичайно, аналіз є більш складним, але це було б поза роботою Economy-Wiki.com, простої економіки.

Як бачимо, вони являють собою набір рівнянь, залежна змінна (y) яких представляє певні бали. Це, в свою чергу, є лінійними функціями інших дискримінантних змінних (X) та ряду параметрів (a).

Завданням цих лінійних комбінацій є максимізація розбіжностей між групами та мінімізація різниці між групами. Таким чином можна згрупувати нові випадки з певною ймовірністю, для яких ми можемо знати їх значення, за умови, що вони відповідають цим критеріям.

Процес, за яким слід провести дискримінантний аналіз

Давайте подивимося, як можна провести аналіз цього типу:

  1. Спочатку вам потрібно створити таблицю даних із випадками та змінними. Також включена категоріальна змінна, яка визначає кожну з груп.
  2. Далі формується математична модель з числовими даними. Це буде базуватися на тому, що ми бачили в попередньому розділі. Статистичне програмне забезпечення, таке як SPSS або безкоштовний R, автоматизує весь процес.
  3. Нарешті, за допомогою цього аналізу ми зможемо пояснити, чому кожен випадок належить до тієї чи іншої групи, і, крім того, встановити критерій членства для нових справ. Це буде базуватися на ймовірності бути охопленим тим чи іншим.

Приклади застосування дискримінантного аналізу

На завершення розглянемо кілька прикладів застосування дискримінантного аналізу.

Давайте також пам’ятатимемо, що у всіх з них метою є створення дискримінантної функції, яка групує кожен новий випадок відповідно до ймовірності.

  • Ми хочемо класифікувати різні країни на основі їх макроекономічних даних: Нерозвинені, розвиваються або розвинені країни (групи). Ми створюємо дискримінантну функцію, щоб ми могли обчислити ймовірність того, що країна належить до тієї чи іншої групи.
  • Ми хочемо провести маркетингову кампанію, і нам цікаво знати, до яких груп класифікувати людей: Таким чином, ми можемо відповісти на певні запитання, такі як те, які будуть характеристики випадкових клієнтів.
  • Ми хочемо знати рівень ризику (групи) певних клієнтів щодо надання позики: Ми будемо використовувати змінні, що стосуються вашого доходу, щомісячних витрат, історії чи виду роботи. Функція дискримінанта надає нам відповідну інформацію про платоспроможність.

Як ми бачимо, дискримінантний аналіз дуже корисний у багатьох ситуаціях. Але не лише пов’язане з економікою, воно також використовується в медицині, геології чи біології, серед інших галузей.