Ступінь свободи - це поєднання кількості спостережень у наборі даних, що змінюються випадковим чином і незалежно, мінус спостереження, які зумовлені цими довільними значеннями.
Іншими словами, ступінь свободи - це кількість суто вільних спостережень (які можуть змінюватися), коли ми оцінюємо параметри.
В основному ми розмежовуємо статистику, яка використовує сукупність та параметри вибірки, щоб знати ступінь свободи. Ми обговорюємо відмінності між середнім та стандартним відхиленням, коли параметри є популяцією чи вибіркою:
Населення та параметри вибірки
- Параметри населення:
Оскільки в популяціях ми не знаємо всіх значень, ступенями свободи будуть усі елементи популяції: N.
Обидві статистичні дані дозволяють всі спостереження в наборі бути випадковими, і, отже, кожного разу, коли ми оцінюємо статистику, ми отримуватимемо різні результати. Тоді спостереження, які мають повне право змінюватися, - це всі спостереження сукупності сукупності. Іншими словами, ступінь свободи в цьому випадку - це всі елементи сукупності: N. З цієї причини ми ділимо обидві статистичні дані на загальний розмір сукупності (N).
- Зразок параметрів (оцінок):
У зразках ми знаємо всі значення.
Ми диференціюємо розмір сукупності (N) з розміром вибірки (n).
Оскільки ми знаємо всі значення у зразках, ми не маємо проблем з обчисленням середнього, оскільки це дозволяє всі спостереження у наборі бути випадковими.
У випадку стандартного відхилення ми вводимо обмеження на ступені свободи: всі елементи вибірки (n) і віднімаємо 1 елемент.
Але … Чому ми віднімаємо лише 1, а не 5 або 10 елементів із вибірки (n)?
Чим більше елементів ми віднімаємо, це означає, що чим більше інформації ми маємо про параметр вибірки, в даному випадку стандартне відхилення.
Чим більше інформації ми маємо, тим менше свободи (ступенів свободи) повинні мати вибіркові спостереження для випадкових значень. Чим більше елементів ми віднімемо від вибірки, тим більше обмежень ми накладаємо і тим менше ступенів свободи буде мати параметр вибірки.
Приклад
Ми припускаємо, що поїдемо до Андорри, щоб побачити фінал Кубка світу з лижного спорту, тому що ми дуже любимо гірські лижі. Ми пропонуємо карту, яка повідомляє нам, де розташовані різні дисципліни, та ім’я деяких учасників, але стартовий номер кожного учасника не вказаний. Щоразу, коли вони вимовляють ім’я учасника, ми дряпаємо їх ім’я. Оскільки список конкурентів обмежений, настане такий момент, що ми будемо знати ім’я конкурента до того, як вони оголошать про це через динаміків.
Ми аналізуємо хроніку з математичної точки зору:
- Розмір вибірки (n), оскільки вони повідомляють нам лише імена деяких учасників.
- Кожен учасник може стартувати довільно, порядок не має значення і не може знову змагатися (комбінації без повторень).
- Останнім учасником буде відомий елемент (n-1). Тоді всі інші учасники можуть випадковим чином вийти, крім останнього, якого ми точно знаємо.
Прочитайте приклад ступенів свободи