Упередженість виживання - це упередженість, яка виникає при збиранні даних, коли дані виключаються з аналізу, оскільки сьогодні вони вже не існують.
Це упередження виникає в широкому розмаїтті контекстів, де ми зосереджуємось лише на тих "збережених" даних. Приклад цього можна побачити, коли компанії опитують своїх клієнтів щодо одного зі своїх продуктів. Але вони залишають своїх не-клієнтів, які в цьому випадку були б «неживими», у забутті.
У цьому випадку робити висновки з цього дослідження було б неправильно. Оскільки результати будуть упередженими лише для "вижилого" населення. І вони не були б репрезентативними результатами.
Упередження виживання на практиці
Яскравий приклад цього упередження можна побачити у дослідженні результатів інвестиційних фондів. Де більшість баз даних включають лише кошти, які існують сьогодні. Незалежно від коштів, які існували в минулому.
Причина, по якій вони сьогодні не існують, полягає в тому, що їх показники були гіршими, ніж “ті, хто вижив”. Або навіть кілька фондів об’єднано в один. Тому аналіз проводиться на ці фонди з найкращими результатами. І це упередження має тенденцію завищувати ефективність вибірки цих фондів.
Основною проблемою цього є вже не просто завищення результатів діяльності фонду. Швидше, обрана вибірка не буде випадковою вибіркою із загальної сукупності. І, отже, результати дослідження можуть бути не репрезентативними для населення. Що врешті-решт саме це ми і шукаємо при відборі випадкової вибірки сукупності.
Рішення упередженості виживання
Уявімо, що ми хочемо вибрати інвестиційний фонд для інвестування, виходячи з його минулого поведінки. Щоб уникнути цього упередження виживання та оптимізувати цей вибір, ми повинні виконати наступні кроки:
- Виберіть часовий горизонт, з яким ми плануємо працювати. Наприклад, десять, п’ятнадцять чи двадцять років історії.
- Візьміть усі існуючі кошти з початку часового горизонту, незалежно від того, чи існують вони зараз.
- Звідти виберіть вибірку з цієї сукупності для вивчення поведінки.
Ідея цього, зрештою, полягає в тому, щоб отримати цю випадкову вибірку сукупності. І звідси отримані висновки, якщо вони могли бути репрезентативними для цієї сукупності.