Исследования · данные · отбор

Ошибка выжившего

Мы делаем выводы по тем, кто «дошёл», и не видим тех, кто выбыл по дороге. Из-за этого успех кажется простым, а опасные места — безопасными. Самая частая ловушка при решениях по данным.

простыми словами

Объясняем на пальцах

«Бросил универ и стал миллиардером» — слышно про единицы. А про тысячи тех, кто бросил и не взлетел, никто не рассказывает: они не попали в подборку историй успеха. Виден только результат победителей.

Военный пример: смотрят на вернувшиеся самолёты, считают пробоины и хотят укрепить там, где их больше. Ошибка: вернулись именно те, кого били в неважные места. Бронировать надо там, где у выживших пробоин нет — туда били сбитые.

01 / выборка

Видно только «дошедших»

Выбывшие не оставляют отзывов, не попадают в статистику и не пишут мемуары. Любой вывод «по успешным» автоматически смещён, потому что неудачи невидимы.

02 / пробоины

Случай Вальда

Математик Абрахам Вальд развернул логику: укреплять не там, где пробоины у вернувшихся, а там, где их нет. Попадания именно в эти зоны и не давали вернуться.

03 / для AI

Смещённые данные

Модель учится на том, что попало в датасет. Если в него входят только «успешные» кейсы, AI уверенно повторит выживших и не увидит причин провалов. Спрашивай: кого в данных нет?

// вернувшиеся бомбардировщики перед тобой вернувшиеся самолёты — где укрепить броню?
Данные, которые видны

Пробоины на вернувшихся самолётах показывают места, где попадание не помешало вернуться.

Данные, которых нет

Сбитые самолёты не попали в выборку. Критические зоны часто выглядят “чистыми” у тех, кто выжил.

Жми вариант. Подсказка: ты видишь только тех, кто долетел обратно.

Зачем это в лаборатории

Спрашивай: кого здесь нет

Это рабочая привычка для аналитики, найма, диагностики и AI: прежде чем учиться на «успешных», найди выбывших. Отзывы, кейсы, метрики, обучающие данные — почти всегда выборка из «дошедших». Самый ценный вопрос к любым данным — не «что они показывают», а «кто в них не попал».

факт

В 1943 в Statistical Research Group Абрахам Вальд анализировал повреждения вернувшихся бомбардировщиков. Военные хотели усилить самые пробитые зоны; Вальд показал, что усиливать надо непробитые — туда били те, кто не вернулся. Его расчёты реально повлияли на бронирование.

Пробоины у вернувшихся показывают, где самолёт выдерживает удар. Усиливать нужно там, где данных нет.

— Абрахам Вальд показал бы

Мы видим то, что выжило, и достраиваем красивую историю причин. Невидимое в эту историю не входит.

— Дэниел Канеман заметил бы

Прежде чем доверять выборке, спросите, какой механизм решал, кто в неё попадёт.

— инженерная привычка
Связано: «помним попадания, забываем промахи» — как у синхронистичности; «уверенность ≠ истина» — как у Монти Холла; «метрика обманывает» — как у закона Гудхарта. Близко и парадокс Симпсона (как нарезаны данные — таков и вывод).