Ми використовуємо власні та сторонні файли cookie, щоб запропонувати кращий сервіс та зручність користування. Чи дозволяєте Ви використовувати дані Вашого приватного перегляду на цьому веб-сайті?

статистика

Під час Другої світової війни американські ВПС шукали шляхи зменшення обстрілів своїх військових літаків, а разом з ними і втрат своїх пілотів. Озброєння літака для підвищення його стійкості до вогню зенітних гармат і винищувачів супротивника має як протилежність збільшення його ваги, що негативно позначається на його експлуатаційних характеристиках. З цієї причини повна броня не була життєздатним рішенням, але питання полягав у тому, чи можна було досягти значного захисного ефекту лише захищаючи певні ділянки літака. Оскільки, можливо, значна частина руйнувань була зумовлена ​​ударами снарядів у дуже конкретних районах.

Щоб спробувати з’ясувати, після кожної місії було записано, скільки літаків ескадрильї впало і скільки повернулось із пошкодженнями чи без них. Ті, хто повернувся пошкодженим, переглядались, щоб визначити, скільки снарядів було вражено та де в літаку вони потрапили. Для візуалізації того, як ці удари були розподілені на корпус літака, зручно позначити всі спостережувані удари на одному літаку, щоб отримати щось на зразок наступного графіка, який показує літак знизу. (Тут ми припускаємо, що всі площини одного типу. Якщо є кілька типів, форми яких суттєво відрізняються, цю вправу можна повторити для кожного типу окремо.)

Статистика на допомогу

Задня частина фюзеляжу та крила, де удари найбільше зосереджені у нашому вигаданому прикладі, можуть на перший погляд стати очевидними кандидатами на броню, як райони, які найбільше вражені ворожими снарядами. Але, як ми побачимо нижче, справа дещо складніша. Настільки, що військові запитали у Група статистичних досліджень, належність до урядової установи, яка координувала науково-дослідну діяльність у військових цілях під час війни, з якої також з'явився Манхеттенський проект розробки атомної бомби.

Розташована в Колумбійському університеті в Нью-Йорку, до складу цієї групи входили деякі найвидатніші математики та статистики 20 століття, такі як Фредерік Мостеллер, Джейкоб Волфовіц, Леонард Джиммі Севідж та В. Аллен Уолліс, її директор з досліджень, а також майбутній Нобелів економічні премії Мілтон Фрідман та Джордж Стіглер. Але в цьому контексті ми повинні виділити перш за все Авраам Вальд, переслідуваний нацистами у Відні через його єврейський статус, він був змушений емігрувати до Сполучених Штатів, де міг покласти піщинку, щоб перемогти нацистську Німеччину. За співпраці Вольфовіца, Уолліса та Фрідмана він розробив статистичну техніку послідовного аналізу, яка суттєво покращила контроль якості промисловості, що мало велике значення у війні. Також він взяв на себе відповідальність за проблему вразливості літаків на основі вищезазначених даних, наданих ВПС.

Великим викликом була відсутність будь-якої інформації про вплив снарядів на збиті літаки, з яких не було відомо, скільки пострілів їх вдарило або де, інформація, яку можна отримати лише з літаків, яким вдалося повернутися. З цієї причини не слід робити поспішних висновків на основі розподілу ударів, який відображається на графіку, оскільки він стосується лише впливу на повернутий літак.

Швидше, питання полягає в тому, чому такий розподіл є належним. Чому деякі райони мають набагато меншу щільність удару, ніж інші, будучи настільки ж підданими вогню противника? Чи ворожі стрільці переважно стріляли у крила, наприклад, а не в область між двома крилами? Окрім того, що для цього не було причин, таке націлювання не здається здійсненним з огляду на швидкість, з якою рухаються літаки.

Виглядає більш реалістичним прийняти нерозбірливий вогонь у напрямку літака або ескадрильї літаків. Отже, можна було очікувати певної рівномірності розподілу ударів, у будь-якому випадку змінюючись залежно від експозиції польоту польоту ПС (наприклад, менше ударів по верхній частині ПС, ніж по нижній частині, що набагато більш опромінений, особливо вогонь із землі). Уолд стверджував, що очікуваний розподіл ударів можна оцінити, зваживши різні орієнтації щодо вогню противника, або за допомогою моделювання повітряного бою нешкідливими патронами фарби, щоб таким чином зафіксувати - без втрат літака - всі удари.

Смертельним є те, чого не спостерігається

Як тільки стане ясно, наскільки грубо постріли повинні бути розподілені по літаках, як ви пояснюєте розбіжності, що спостерігаються у повертаються літаках? Тлумачення полягає в тому, що якщо на носі або тій частині між крилами, де розташовані двигун і салон, спостерігається набагато менше ударів, ніж очікувалося, це пов’язано з тим, що багато з цих ударів не було зафіксовано, оскільки багато літаків ці райони не повернулися. Отже, це найбільш смертельні наслідки, які в більшій мірі призводять до падіння літака. З іншого боку, більша концентрація на крилах або задній частині фюзеляжу вказує на те, що ці удари дозволяють повернутися у значно більшій мірі.

Висновок полягає в тому, що найбільш вразливі райони, найбільш показані для можливого екранування, - це не ті райони з найбільшим зафіксованим ударом, а ті, де спостерігалося найменше щодо того, що можна було очікувати! Наші спостереження за попаданнями не точно відображають вогонь противника по літаку в цілому, але є перекошеними через обмеження на повернення літаків, що виключає збитих. Більше того, спостережувані наслідки мають найбільше турбувати нас, оскільки вони все-таки дозволили повернутися. Перш за все ми повинні запитати себе про те, як розподіляються ті наслідки, які ми не спостерігали, ті, що збили літак.

Уолду вдалося знайти спосіб оцінити ймовірність збиття на основі кількості отриманих пострілів, що може здатися майже наче магічним актом, знаючи ці дані лише для літаків, що повернулися, а не для тих, які були втрачені. Це вирішило це індуктивно, припускаючи, що не було втрачених літаків без ударів. Це правда, що не можна виключати втрати внаслідок інших причин, таких як аварії, але їх розмір буде незначним порівняно з дуже частими знесеннями, враховуючи низьку ймовірність повітряної аварії. (Трагедія полягає в тому, що, однак, сам Уолд загинув у 1950 році у віці 48 років у авіакатастрофі разом зі своєю дружиною, вирушаючи на конференцію в Індію).

Звідти Вальд також вивів формули для розрізнення ймовірності нокдауну за типом снаряда та - як ми описали хоча б якісно - за місцем удару. У числовому прикладі з вигаданими даними, що з’являються в його складному та технічному дослідженні, Вальд розрахував 15% ймовірності падіння літака від одного отриманого пострілу, але якщо врахувати місце удару, воно коливається між 39% - це двигун або двигуни і 2%, якщо це периферійні зони, такі як крила.

Перед узагальненням запитайте себе, як вибрати

Робота Уолда була опублікована лише в 1980 році, хоча його висновки застосовувались військовими ще в роки Другої світової війни та в подальших конфліктах. І зокрема, його висновки щодо відповідних місць для екранування набули певної популярності поза науковими колами, викликавши навіть легенди, де вигадка змішується з реальністю. Ця популярність багато в чому пояснюється уроками, які можна засвоїти.

Це яскравий приклад того, як узагальнення, засноване на упереджених спостереженнях, може спотворити наше сприйняття реальності, в даному випадку аж до плутанини найбільш вразливих районів з найменш вразливими. Але, наприклад, в опитуванні громадської думки, як правило, опитують лише вибірку з кількох сотень або тисяч людей, з якої вона узагальнюється для всього населення. Від чого тоді залежить, чи є узагальнення законними чи ні?

Ключовим є те, як були отримані дані. Опитування громадської думки, яке претендує на репрезентативність, вимагає процедури вибірки, спрямованої на уникнення упередженості. Критично важливим фактором є можливість припустити, що зі збільшенням обсягу вибірки вона, як правило, представляє сукупність все краще і краще, як вчить нас статистичний висновок. Якщо відмовитися від такої процедури, опитування навряд чи можна вважати репрезентативним. Якщо вибір проводиться, наприклад, виходячи на вулицю, щоб запитати у перехожих, чи є у них хвилина, щоб відповісти на деякі запитання, і лише вибране місце та час можуть в значній мірі обумовити профіль опитаних. При цьому клімат думок, відображений в опитуванні, може бути абсолютно різним залежно від того, коли і де проводяться співбесіди.

Всякий раз, коли не існує конкретної процедури відбору проб, а досить простого спостереження, варто запитати, чи спосіб спостереження сприяє включенню одних елементів на шкоду іншим, таким чином, що це може бути пов'язано з характеристиками, які ми хочемо спостерігати. Якщо так, це можливе джерело упередженості, і бажано бути дуже обережними з узагальнюючими висновками, як ми вже бачили тут: літак з периферійним ударом матиме набагато більше шансів повернутися і, таким чином, увійти до нашого відбору, ніж літак з двома ударами про його двигун і одним - про кабіну. Тому літак, який повернувся, як правило, матиме менше ударів і в менш чутливих районах, ніж збитий літак, що дає нам перекошений погляд, надмірно доброзичливий з точки зору збитків.

Коли невдачі можуть навчити нас стільки чи більше, ніж успіхи

Це суттєвий приклад того, що відомо як упередження виживання, дуже поширений у багатьох різних контекстах. Це проявляється в процесах, які долаються деякими вижилими, які спостерігаються, тоді як є інші, які залишаються на дорозі і не мають видимості, але які можуть мати таку саму або більшу актуальність, ніж ті, хто вижив.

Якщо лікар оцінює ефективність та переносимість лікування на основі огляду пацієнтів в кінці лікування, слід звернути увагу на пацієнтів, які не відвідують остаточний огляд, і спробувати з’ясувати причини. Якщо ці випадки просто залишити поза дослідженням, оскільки їх неможливо пройти обстеження, існує ризик упередженості, виключаючи пацієнтів, у яких лікування дало найгірші результати, оскільки цілком ймовірно, що багато хто з тих, хто кинув школу, пояснюється тим, не допомогти хворому, пацієнту чи вам було погано.

Упередженість також відома у фінансовому секторі, наприклад, у селективних фондових індексах, що складаються з компаній з найвищою ринковою вартістю на ринку, таких як IBEX 35 у випадку Іспанії. Індекс обтяжується падінням на фондовому ринку інтегрованих у нього компаній, але лише до певної міри: Якщо падіння означає, що компанія втрачає позиції в рейтингу найцінніших до виходу з селективного індексу, що трапиться згодом, це більше не впливатиме на індекс, навіть якщо він зазнає невдачі і втрачає практично всю свою ринкову вартість. Тому розвиток селективного індексу за останні п’ять років, як правило, є більш позитивним, ніж середньозважений розвиток компаній, які його сформували 5 років тому, виключаючи найгірші зміни.

Є також багато книг, які пояснюють, чому певні престижні компанії досягли успіху, ніби їх успіх був логічним і неминучим наслідком низки якостей та правильних рішень, ігноруючи той факт, що ніхто не знає, скільки інших компаній, які відповідно до цього успіху рецепти мали б бути однаково успішними, але ні, просто тому, що їм пощастило менше. Таким чином, передається (майже завжди помилкове) враження, що застосування певних рецептів достатньо, щоб мати високі шанси на успіх, недооцінюючи величезний вплив факторів, абсолютно поза нашим контролем.

Або подумайте про помилкові надії багатьох молодих людей стати зірками футболу, кіно, музичними зірками, подіумами тощо, що підсилюється висвітленням у персонажах цих типів персонажів, що контрастує з мізерною увагою, яку переважна більшість пробитися в ці професії, не досягаючи вершини, і яким залишається лише вибрати, чи відмовитись від свого покликання, чи жити з нього.

Інший приклад наводять багатовікові будівлі, якими ми сьогодні можемо милуватися і які можуть навести нас на думку, що на той час усі міста були набагато красивішими, ніж зараз. Але слід враховувати, що це враження ґрунтується лише на тих спорудах, які були достатньо якісними, щоб прослужити століттями і які вважалися гідними збереження наступними поколіннями, тим самим звільняючи їх від руйнування. Тому мова піде про будівлі, які вже були найбільш емблематичними на той час, тоді як з основної маси скромних споруд тих часів у нас навряд чи залишилось свідків.

Щось подібне відбувається з кінофільмами та музичними постановками. Більшість швидко забуваються, але деякі запам’ятовуються і оцінюються навіть наступними поколіннями, стаючи класикою. З цієї причини фільми та пісні, які відомі ще до їхнього часу, зазвичай обмежуються цими пам'ятними класиками та виключають класику партії, що також може спричинити ідеалізоване зображення творів тих часів.

До все гіршого світу?

Ці два останні приклади показують, як упередження щодо виживання може сприяти, разом з іншими аспектами людської психології, надмірно романтичному та ностальгічному баченню "старих часів", завжди кращому за сучасність, а разом із цим і широкому сприйняттю, що світ завжди погіршується, навряд чи є стійким з огляду на об’єктивні дані, але підсилюється іншим упередженням, в даному випадку інформативним.

Виявляється, ми отримуємо все більше і більше новин, навіть із найвіддаленіших куточків світу і з акцентом на проблеми, про які раніше мовчали, і з дедалі різноманітніших джерел, і кожен, хто має телефон із камерою, може стати репортером. І оскільки новини майже завжди погані, з невеликою кількістю хороших подій, що дають історію, створюється помилкове враження, що зло трапляється все більше і більше, що також сприяє надмірно песимістичному погляду на еволюцію світу.