«А вот у меня…», статистика и таблицы сопряжённости

Одна из самых распространённых «ловушек мышления» – обобщение частных случаев.


Недавно по соцсетям гуляла фейковая новость о том, что некая Елизавета Спиридонова (30 лет, г. Мурино) якобы скончалась после прививки «Спутником V». Противники вакцинации активно комментировали и распространяли пост о смертельных «побочках», несмотря на упоминание синдрома с подозрительным названием «jopae otvalille».

А потом кто-то обнаружил, что в качестве фото Елизаветы автор использовал сгенерированный нейросетью портрет девушки с лицом Илона Маска, который в 2020 году был выложен в аккаунте Instagram @neural_tp.

Шах и мат, излишне доверчивые.


Как же критически подходить к таким вещам?
Можно взять на вооружение статистику.


Например, одна из самых острых тем нашего времени – прививки. Сестра подруги вашего знакомого заболела почти сразу после второй дозы. А ещё жена коллеги. И брат женщины из автобуса. Вот уже как минимум три случая! Неужели вакцинация не эффективна?
Три случая, пять или все сто – это не статистика. Чтобы найти статистически достоверное решение, нам понадобится таблица сопряжённости.


Сопрягать будем две переменных для одной и той же выборки людей: вакцинированность и болезнь. Сколько человек сделали/не сделали прививку и сколько из них заболели/не заболели. Как вариант: перенесли болезнь легко/были госпитализированы в связи с болезнью. Чем больше выборка и чем лучше она отражает всю популяцию, тем лучше.Наша нулевая гипотеза: вакцинация никак не связана с заболеванием, а видимый эффект от прививки случаен. Из этой гипотезы следует, что ожидаемая доля заболевших среди вакцинированных будет той же, что и ожидаемая доля заболевших среди тех, кому прививку не делали.


Сравниваем наблюдаемый результат с ожидаемым – насколько они расходятся? Если фактическое распределение сильно отличается от ожидаемого, истинность нулевой гипотезы сомнительна.


По данным крупного онлайн-ресурса Our World In Data, в России к 18 июля 2021 года были полностью вакцинированы 20,7 млн людей. Сопоставимо ли это количество с тремя известными вам случаями? Вопрос риторический.

Понятно, что для применения таблицы сопряженности информации может не хватать. Чем сложнее тема, тем труднее раздобыть данные.


Просто помните: на каждый известный вам случай найдётся несколько миллионов других, от них отличных.

А если вы хотите подробнее почитать про таблицы сопряженности, но боитесь учебников по статистике – не бойтесь 😊
Возможно, чуть менее информативно, но более увлекательно об этом пишет наш любимый Ричард Нисбетт. О таблицах, о манипулировании выборками и о попытках выдать частный случай за общее правило. Понятно и с примерами.


Книга называется «Мозгоускорители. Как научиться эффективно мыслить, используя приемы из разных наук». Глава 8.


Рекомендуем!