Достатня статистика - що це таке, визначення та поняття

Зміст:

Anonim

Достатньою статистикою для параметра Θ є та, яка здатна зібрати або узагальнити всю інформацію, яку містить вибірка випадкової величини X.

Ми знаємо, що статистика є реальною функцією вибірки. Тобто він приймає реальні значення, що містяться у вибірці. Звідси, як ми бачили у статті, в якій визначено поняття статистики, ми повинні переконатися, що статистик має певні властивості. Навіщо вимагати такі властивості? Щоб статистика корисна для наших цілей.

Достатність - одна з таких властивостей. Набагато простішим способом ми скажемо, що статистики достатньо, якщо вона використовує всю інформацію, що міститься у вибірці.

Як дізнатися, чи достатньо статистики?

Логічно виникає запитання: як я можу дізнатися, чи відповідає статистика Т властивості достатності? Або як я можу знайти статистику, яка відповідає властивості достатності, якщо вона існує. Відповідь на ці два запитання можна знайти у двох теоремах:

  • Критерій факторизації Фішера-Неймана: Цей критерій стверджує, що за умови статистики Т, якщо вона відповідає певним умовам, тоді вона буде достатньою статистикою.
  • Теорема Дармуа: Ця теорема відповідає на друге питання. Тобто це дозволяє нам знайти достатню статистику за допомогою низки процедур.

Приклад достатньої статистики

Припустимо, ми хочемо розрахувати середньорічний дохід сімей, які проживають у Чилі. Для цього ми виконаємо наступний процес:

  1. Збір інформації (зразок): Оскільки ми не можемо запитати кожну з сімей, які проживають у Чилі, скільки вони заробляють щорічно, ми візьмемо репрезентативну вибірку, наприклад, з 1000 сімей.
  2. Визначте досліджувану випадкову величину: Випадковою величиною, що досліджується, є сімейний дохід. Отже: X → Сімейний дохід
  3. Виберіть правильну статистику: Відповідною статистикою для обчислення середнього доходу є не що інше, як очікування X. Іншими словами, вибіркове середнє значення X.
  4. Як я можу дізнатися, чи є середня статистика вибірки достатньою? Оскільки ми вже маємо математичний вираз статистики, ми будемо використовувати критерій факторингу Фішера-Неймана. Або теорема Дармуа. Вони є формулами, створеними для цієї мети.

Застосувавши належні розрахунки, ми дійшли висновку, що середня статистика вибірки відповідає вимозі або властивості достатності. Переконуючись, що він відповідає цій вимозі, ми гарантуємо, що ця (статистична) функція, яка дозволяє нам синтезувати інформацію (середній дохід), використовує всю інформацію, що міститься у вибірці (1000 сімей).

Чому важливо, щоб я використав всю інформацію у зразку?

Тепер, коли ми знаємо, що середнє значення вибірки є достатньою статистикою, припустимо випадок. Який сенс матиме бажання розрахувати середній дохід на основі цих 1000 чилійських сімей, і що ми використовуємо дані лише 500 сімей?

Звичайно, це не мало б сенсу. Ми хочемо узагальнити всю інформацію. Тобто те, що ми визначили як достатню статистику.