Видно только «дошедших»
Выбывшие не оставляют отзывов, не попадают в статистику и не пишут мемуары. Любой вывод «по успешным» автоматически смещён, потому что неудачи невидимы.
Мы делаем выводы по тем, кто «дошёл», и не видим тех, кто выбыл по дороге. Из-за этого успех кажется простым, а опасные места — безопасными. Самая частая ловушка при решениях по данным.
«Бросил универ и стал миллиардером» — слышно про единицы. А про тысячи тех, кто бросил и не взлетел, никто не рассказывает: они не попали в подборку историй успеха. Виден только результат победителей.
Военный пример: смотрят на вернувшиеся самолёты, считают пробоины и хотят укрепить там, где их больше. Ошибка: вернулись именно те, кого били в неважные места. Бронировать надо там, где у выживших пробоин нет — туда били сбитые.
Выбывшие не оставляют отзывов, не попадают в статистику и не пишут мемуары. Любой вывод «по успешным» автоматически смещён, потому что неудачи невидимы.
Математик Абрахам Вальд развернул логику: укреплять не там, где пробоины у вернувшихся, а там, где их нет. Попадания именно в эти зоны и не давали вернуться.
Модель учится на том, что попало в датасет. Если в него входят только «успешные» кейсы, AI уверенно повторит выживших и не увидит причин провалов. Спрашивай: кого в данных нет?
Пробоины на вернувшихся самолётах показывают места, где попадание не помешало вернуться.
Данные, которых нетСбитые самолёты не попали в выборку. Критические зоны часто выглядят “чистыми” у тех, кто выжил.
Жми вариант. Подсказка: ты видишь только тех, кто долетел обратно.
Это рабочая привычка для аналитики, найма, диагностики и AI: прежде чем учиться на «успешных», найди выбывших. Отзывы, кейсы, метрики, обучающие данные — почти всегда выборка из «дошедших». Самый ценный вопрос к любым данным — не «что они показывают», а «кто в них не попал».
В 1943 в Statistical Research Group Абрахам Вальд анализировал повреждения вернувшихся бомбардировщиков. Военные хотели усилить самые пробитые зоны; Вальд показал, что усиливать надо непробитые — туда били те, кто не вернулся. Его расчёты реально повлияли на бронирование.
Пробоины у вернувшихся показывают, где самолёт выдерживает удар. Усиливать нужно там, где данных нет.
Мы видим то, что выжило, и достраиваем красивую историю причин. Невидимое в эту историю не входит.
Прежде чем доверять выборке, спросите, какой механизм решал, кто в неё попадёт.