ЗМІ охопила хвиля повідомлень про вірус, який робить нас дурними. Це нібито довів Ярослав Флегр із командою Карлового університету та Державного інституту громадського здоров'я, стаття якого була опублікована в журналі Nature. Я хотів написати про те, що повідомлення в ЗМІ перебільшені, що вірус знижує інтелект лише невеликим, зовсім незначним фрагментом у повсякденному житті. Після ретельного прочитання дослідження я не думаю так: мені здається, що дослідження не показує нічого подібного, і все це зовсім інакше.
На думку авторів, дослідження має показати, що люди, заражені цитомегаловірусом, більш дурні. Як вони самі визнають, це можна пояснити кількома способами: вірус (1) може погіршити інтелект, або (2) вищий інтелект може допомогти нам не піддаватися інфекції або піддаватися пізніше, тим самим зменшуючи тривалість вірусу. Як варіант, (3) на обидва можуть впливати третій фактор: наприклад, магічна аура, яка робить нас розумнішими та стійкішими до вірусу або щось менш магічне, якась комбінація генів, впливів навколишнього середовища, властивостей, нашої поведінки…
Як виміряти макроси
Припустимо разом з авторами, що ні другий, ні третій варіант не застосовуються. Чи означає це, що застосовується перший? Уявіть, як працює таке дослідження, на простому прикладі: якби ми мали виміряти, чи більші собаки, ніж коти. Недостатньо порівняти Дунчу з Міцькою, бо якби Дунчо був чихуахуа, ми могли б легко помилитися і стверджувати, що коти потужніші. Нам потрібно більше собак і більше котів. Якби ми мали їх нескінченно (або всіх, хто коли-небудь жив, живе і буде жити), ми могли б достовірно довести, що собаки більші.
Однак, якщо ми вимірюємо лише обмежену їх кількість, завжди може трапитися так, що ми випадково вибрали певних маленьких собак і великих котів - і наші результати будуть помилковими.
Поки ми цього не отримаємо ...
Таким чином, ми не можемо науково довести більш високий ріст собак на 100%: ми виявляємо лише те, що якесь пояснення є дуже імовірним. Тому дослідники погодились прийняти як "підтверджені" результати, які мають максимальну ймовірність випадково відбутися. На практиці це означає, що якби ми двадцять разів науково перевірили стосунки, яких насправді не існує, приблизно колись результати помилково підтвердили б його існування.
У той же час ключова статистика команди Флегра набагато перевищує встановлену межу: ймовірність того, що вчені досягли своїх результатів за простим збігом обставин, менше одного проміля. Проблема в тому, що ми не знаємо, скільки вірусів вони протестували - і скільки разів хтось інший тестував цитомегаловірус. Проводиться багато досліджень, і невдалі стануть на свої місця. Коли Флегров та інші лабораторії по всьому світу неодноразово перевіряють свої гіпотези, іноді позитивні результати, природно, повинні бути отримані за звичайним збігом обставин.
Імовірність отримання випадкових результатів, як досягли автори дослідження, невелика, але все ж більша, ніж можливість того, що шість упаде на куб чотири рази поспіль. Гравці Чоловіче, не гнівайтесь! вони знають, що це іноді трапляється, але як часто це не відбувається, ми не знаємо, скільки разів Флегр та інші вчені "кидали". Крім того, ми не можемо виключити будь-яку неточність, яка спотворює результати - тому шістки можуть з якихось причин падати частіше. Давайте зараз опустимо ці сумніви, приймемо, що це не було випадковістю. Що це означає?
Невидимі коти
Люди, які тривалий час були заражені вірусом, набирають на чотири-два бали краще під час певного "тесту інтелекту" на двох із семи підрахувань. Краще, не гірше: автори вимірювали "зараження" рівнем антитіл і стверджують, що серед групи неінфікованих є 5-10% тих, хто заражений найдовше, тому їх антитіла вже зникли. Тож вони найдурніші. Якщо повернутися до собак і котів: автори стверджують, що коти вийшли більшими за собак, бо між ними випадково пробігли кілька порослих бернардинів.
У даних, опублікованих авторами, але я не можу знайти жодного бернардинця, і що вони повинні були б там бути чортово приємними, щоб побачити!
За шкалою вербальних знань, де найбільша різниця була, "заражені" в середньому становили 121, тоді як "неінфіковані" в середньому 117. Якщо теорія авторів відповідає дійсності - а вірус насправді знижує інтелект - людям, які не постраждали від вірусу, доведеться набирати більше ніж ті інваліди (в середньому 121). Отже, вірус, дійсно недоторканний, повинен мати близько 123 (це коти).
Найніміші студенти коледжів у світі
У той же час серед них було змішано 5-10% довгостроково інфікованих людей (тих бернардинів), які змішали своє середнє значення до виявлених 117 балів. Якщо ми приймемо максимальну помилку авторів у десять відсотків, це означатиме, що десята частина учасників зменшить оцінку всієї групи зі 123 (фактичне середнє значення) до 117 (середнє значення після домішок бернардинів). Але для того, щоб десята частина людей досягла цього, вони мали б мати бал близько шістдесяти: на рівні розумової вади.
Вони були студентами коледжу: чи ніхто не може помітити, що вони абсолютно дурні? Не знаю, але відповідь повинні надати дані, опубліковані авторами (що є зразковим і чудовим!). У даних, однак, така десята частина дурнів відсутня: вся група є досить послідовною, лише троє з респондентів мають менше ста балів за результатами 94, 97 і знову 97.
Після завантаження даних ми можемо ще чіткіше спростувати гіпотезу авторів. Якщо ми візьмемо десять відсотків найгірших результатів (тих гіпотетичних бернардинів) з групи неінфікованих і переведемо їх до групи інфікованих, ті, хто залишиться здоровим, все одно досягнуть гірших результатів. Гіпотеза про те, що десята частина тих, хто насправді був інфікований дуже довго, відстає від нижчих результатів групи неінфікованих, є помилковою.
Ми в середньому жителі Братислави
То чи є серед котів більше десяти відсотків бернардинів? Для того, щоб здорові люди досягли результату 121, якого досягла початкова група пацієнтів, ми повинні були б позначити 28% найгірших з них як хворих. Однак ми не маємо підстав для такого втручання в дані. Це та сама нісенітниця, ніби ми прагнули довести, що коти більші за собак, вони поступово відбирали всіх великих собак із спочатку випадкової вибірки, поки не залишились лише ті, приблизно таких самих розмірів, як коти.
Більше того, це саме по собі нічого не доводить: здорові люди не повинні мати однакових, але кращих результатів, ніж заражені.
Для того, щоб мати можливість з прийнятною ймовірністю (5%, про які я згадував вище) показати, що здорові люди насправді мають вищий рівень успіху в тій чи іншій частині тесту на IQ, їм доведеться досягти щонайменше 123 балів. Однак для цього нам довелося б взяти ще вісімнадцять найгірших людей із вихідної вибірки із 135 особин.
Іншими словами: дані підтверджують гіпотезу авторів, якщо ми довільно обираємо трохи більше половини найкращих із здорових. Якщо ми це зробимо, це те саме, що якщо ми вибрали середньостатистичних жителів Кошице та високих жителів Братислави і, виходячи з цього, вони хотіли стверджувати, що західники вищі за східників. Вони можуть бути - але таких даних не можна зробити.
Ні, навпаки
Дані команди Flegr, навпаки, свідчать про те, що це не так. Якщо ми уявимо, що ефект вірусу буде настільки сильним, що можна буде переселити майже половину тих, хто досяг найгірших результатів, ми, безсумнівно, бачимо такі випадки в даних навіть без статистичних даних: було б зрозуміло, що група "здоровий" включає дві різні підгрупи. Окрім простого погляду, таке лікування можна побачити також у статистичних значеннях: наприклад, у "змішаній" групі дисперсія повинна бути вищою, ніж у більш стійких результатах групи, де всі заражені.
Однак це не так: дисперсія "змішаної" групи схожа, навіть дещо менша, і набір має досить нормальний розподіл згідно з тестом. Тому ми повинні або відкинути гіпотезу авторів, або сказати, що описаний ефект дуже малий, тому його не видно на даних. Однак у той же час ми знаємо, що якби ефект був дуже малим, ми б не могли пересувати людей між групами через це - тому таке пояснення здається малоймовірним.
Повернемось до початку
Автори використовують більш складну статистику, яка працює з вісьмома вимірюваними вимірами інтелекту, і, крім того, математично очищають виміряні величини від впливів віку та статі, чого я не роблю в міркуваннях, викладених вище. Приклад із конкретним виміром, в якому виміряна різниця є найбільш вираженою, тому вона нічого не спростовує, вона служить лише прикладом того, чому (і не тільки) тлумачення авторів викликає у мене недовіру. Для більш точної критики необхідно було б провести більш глибокий статистичний аналіз, який я люблю залишити вірусологам, оскільки немає сенсу проводити його без розуміння процесів, що стоять за виміряними значеннями. Однак аналогічні проблеми ховаються в даних, їх просто не так добре уявити.
Зважаючи на нашу нездатність обґрунтовано пояснити, що лежить в основі вимірюваних результатів, ми повинні запитати, чи все зовсім інше. Ми можемо повернутися до початку історії і запитати, наскільки за виміряними результатами може бути несподіваний збіг збігів та обставин чи інших факторів, тієї магічної аури, а також шукати модель, яка б краще пояснила результати дослідження, ніж запропоноване авторами.
Що ми насправді виміряли?
Ми знаємо, що вчені використовували Тест інтелектуальної структури (IST) для вимірювання десяти різних характеристик інтелекту, і двоє з них виявили, що вони дещо відрізняються. Але ми не знаємо, чому і чим вони відрізняються. У базових дослідженнях це може бути цікаво, але для пересічної людини така знахідка не має наслідків. Виміряна різниця між групами відповідає двом поганим реакціям протягом двох годин інтенсивного тестування.
З точки зору людини, абсолютно незначна матерія, що має в рази менший вплив, ніж те, як він спав перед тестуванням.
Для повноти додамо, що тести IST є стресовими через жорсткі обмеження часу, тому на результати впливає не тільки інтелект, але також увага, нервозність та інші фактори. Але також той факт, що автори використовували тест з порушенням відповідних нормативних актів та посібників, тому його також можна поставити під сумнів, чи вимірювали вони інтелект взагалі, чи щось зовсім інше. Але навіть якщо ми залишимося з одним відсотком інтелекту, яким ці дві групи нібито відрізнялися: яка його роль?
У реальному житті, крім уваги та нервозності, на нас впливає і незліченна кількість інших впливів, які принципово збільшують або пригнічують прояви інтелекту. Отже, успіх у відповіді на запитання в тестах на IQ пов’язаний із здатністю вирішувати реальні проблеми та досягати успіху в чомусь, але лише дуже вільно.
Коротше кажучи, дія вірусу не робить нас дурними - а якщо так, то надзвичайно мало, що ніхто не знатиме. Якщо існує загроза нашій розвідці, це, скоріше, засоби масової інформації надули результати дослідження до абсурду, навіть не цікавлячись явними методологічними помилками.
Хвороби йдуть не в гори, а до людей. Навіть якщо ви не можете повністю підготуватися до них заздалегідь, мало що можна зробити ... Ми підготували для вас новий спеціальний мікросайт під назвою Скільки коштує здоров’я? Дізнайтеся, скільки триває ваша середня непрацездатність, або на яку державну підтримку ви маєте право, якщо довго хворієте.
- Це ворота до пекла в Росії
- Кан Лі Ви справді можете сказати, чи бреше дитина підзаголовкам TED Talk та розшифровці TED
- Клейковина дійсно шкідлива
- Граздічка пом; ха розв; взяти дитину; це справді так; Іграшки, ігри, гребінці; ранінки; Зірка; мені sa
- Джеремі Кларксон з журналу Top Gear є расистом для людей!