Упередженість у збиранні даних

Зміст:

Упередженість у збиранні даних
Упередженість у збиранні даних
Anonim

Упередженість збору даних виникає, коли ми помилково відбираємо суб'єктів, які належатимуть до випадкової вибірки, що аналізується.

У нас проблема, коли цей вибір робить випадкову вибірку не репрезентативною для статистичної сукупності. І тому будь-який результат, який ми отримуємо з вибірки, є упередженим, і ми не могли стверджувати, що він був виконаний в аналізованій сукупності.

Упередженість виживання

Виникає, коли дані виключаються з аналізу, оскільки вони більше не існують на момент аналізу.

Іншими словами, ми зосереджуємось лише на даних, що існують, і відкидаємо ті, що раніше існували в популяції. На практиці існує безліч прикладів такого типу упередженості. Один з них - проводити опитування лише серед клієнтів компанії, виключаючи потенційних клієнтів. Іншим завданням було б оцінити поведінку фондових індексів, виключивши з аналізу компанії, які в цьому індексі були і не перебувають.

Рішення цього упередження дуже просте. Проведіть дослідження з усіма наявними та існуючими даними.

Упередженість передбачення

Це відбувається, коли аналіз виконується з використанням даних, недоступних на момент аналізу. Прикладом може бути аналіз зв'язку ціни акції з деякою змінною фінансового балансу. Ціна акції є динамічною змінною, якщо ми маємо правильну інформацію на момент аналізу. Однак змінні, встановлені в балансі, є статичними, і тому нам слід почекати публікації фінансової звітності для цього аналізу.

Припустимо, ми хочемо вивчити взаємозв'язок між ціною та власним капіталом для ряду компаній наприкінці фінансового року. У цьому випадку ми не матимемо даних про власний капітал до публікації фінансової звітності. Публікація, яка зазвичай видається через пару місяців після закінчення фінансового року.

Отже, рішенням цієї упередженості було б почекати публікації фінансової звітності. І виконайте аналіз з опублікованими даними разом із ціною на момент публікації.

Упередження періоду часу

Це упередження виникає, коли вибраний для даних період занадто короткий або занадто довгий. Якщо він занадто короткий, аналіз може відображати конкретні результати, які досягнуті лише за цей період. Тобто вони не були б представницькими протягом тривалого періоду часу.

Уявіть собі п’ятирічні терміни, коли малі компанії випереджали великі компанії на фондовому ринку. З цього можна зробити висновок, що в майбутньому малі компанії завжди перевершуватимуть великі. Але за такий короткий проміжок часу таких висновків зробити не можна. В основному через те, що за триваліші періоди часу ситуація може змінитися. Отже, отримані результати мають тенденцію до цього скороченого періоду часу.