Статистична нормалізація - що це таке, визначення та поняття

Зміст:

Anonim

Статистична нормалізація - це масштабне перетворення розподілу змінної для того, щоб мати можливість проводити порівняння щодо наборів елементів та середнього значення, усуваючи ефекти впливів.

Іншими словами, нормалізація - це пропорції без одиниць виміру (безрозмірна або інваріантна до масштабу), які дозволяють порівнювати елементи різних змінних та різних одиниць виміру.

У статистиці та економетриці стандартизовані таблиці розподілу ймовірностей використовуються для знаходження ймовірності, яку приймає спостереження, враховуючи функцію розподілу, за якою слід змінна.

Важливо не обмежувати термін нормування лише наборами елементів, де нормальний розподіл є хорошим наближенням до їх частоти.

Статистична змінна

Таблиця

Наступна таблиця детально описує найпоширеніші стандартизації статистики, що застосовуються до фінансів та економіки.

  • Типовий або стандартний бал нормалізує помилки, коли ми можемо обчислити параметри вибірки.
  • Нормалізація розподілу t Стьюдента нормалізує залишки, коли параметри невідомі, і ми робимо оцінку для їх отримання.
  • Коефіцієнт варіації використовує середнє значення як міру шкали, на відміну від стандартизованого балу та t Стьюдента, які використовують стандартне відхилення. Розподіл нормується для пуассонівського та експоненціального розподілів.
  • Стандартизований момент можна застосувати до будь-якого розподілу ймовірностей, який виконує функцію, що генерує моменти. Іншими словами, що інтеграли моментів збіжні.

Програми

Скільки разів ми читали, що нормальний розподіл ймовірностей здається достатньо наближеним до частоти спостережень, і нас просять знайти ймовірність того, що змінна X приймає конкретне значення?

Іншими словами, встановлюємо X ~ N (μ, σ2), і нам пропонують знайти P (X ≤ xi)

Ми знаємо, що для знаходження P (X ≤ xi), нам потрібно шукати ймовірність у таблицях розподілу ймовірностей. У цьому випадку в таблицях розподілу нормальний розподіл. Найбільш широко використовуваними таблицями розподілу ймовірностей в економетриці та кількісних фінансах є: хі-квадрат, t-код Стьюдента, F-Фішера-Снедекора, Пуассон, експоненціальний, кошовий та стандартний нормальний.

Імовірності, розраховані в таблицях розподілу, відповідають властивості:

Тобто ймовірності (цифри в таблиці) типізуються. Тоді нам також доведеться набирати нашу змінну відповідно до параметрів функції розподілу, якщо ми хочемо знайти ймовірність P (X ≤ xi).

Практичний приклад

Ми хочемо знати ймовірність того, що кількість лижників, які катаються на лижах у п’ятницю вранці, становить 288.

Гірськолижний курорт повідомляє нам, що частота змінної лижників може приблизно відповідати нормальному розподілу середнього значення 280 та дисперсії 16.

Отже, маємо:

X ~ N (μ, σ2)

де X визначається як змінна "лижники"

Вони запитують нас про ймовірність того, що кількість лижників, які їдуть на лижах у п’ятницю, менше або дорівнює 288. Тобто:

P (X ≤ 288)

Процес

Щоб знайти ймовірність того, що кількість лижників дорівнює 288, спочатку потрібно ввести змінну.

Тоді ми розглядаємо таблицю розподілу неперервної стандартної нормалі:

Z 0 1 2 3
2,0 0,9772 0,9778 0,9783 0,9788

Імовірність того, що 288 лижників підуть на лижі в п’ятницю вранці, становить 97,72%, враховуючи середнє значення та параметри дисперсії.