Уволен после заявлений о фальсификации
28 октября, 2020 8:48 дп
Мэйдэй
Alexander Ku поделился
Познавательно
Инсайдер:
Вторая волна как девятый вал. Открытые данные говорят о катастрофической эпидемии в России
Александр Драган
26 октября 2020
Официальная российская коронавирусная статистика во время второй волны вызывает не меньше вопросов, чем во время первой. Например, в Санкт-Петербурге уже несколько недель ежедневное число выздоровевших ровно вдвое меньше числа заболевших. Но если реальные цифры можно скрыть, поисковые запросы людей — открытая информация, и они точно коррелируют с заболеваемостью, госпитализациями и смертями, выяснил маркетолог Александр Драган. Результаты анализа шокируют: уже к середине октября эпидемия, на этот раз накрывшая большую часть страны, была масштабнее весенне-летних пиков в 4 раза, а стандартного сезонного уровня — в 140 раз. Хуже всего ситуация в Сибири. Исследование помогает не только понять реальную картину, но и спрогнозировать загрузку больниц, ведь рост специфического запроса «пропало обоняние» опережает официальный рост заболеваемости.
Метод
Он прост и доступен каждому. У Яндекса есть Вордстат — инструмент, который позволяет смотреть помесячную или понедельную динамику показов по нужным поисковым запросам. И есть особые «коронавирусные» запросы, которыми с большей вероятностью будут пользоваться заболевший человек и его близкие. Как правило, это запросы максимально практичные: связаны либо с самыми специфичными симптомами ковида (такими, как пропажа обоняния и вкусов), либо с конкретными лекарствами, либо с диагностикой. Подробнее про метод можно почитать здесь и здесь. Главная идея — есть запросы, которые наиболее точно коррелируют с реальной заболеваемостью.
Эпидемия в России продолжается уже более полугода. И если поисковые запросы отражают реальный ход эпидемии, это легко проверить: достаточно сопоставить запросы с заболеваемостью, госпитализациями и смертями. Но выявленные случаи — недостаточно достоверный показатель, а официальная статистика ещё с весны вызывает вопросы и давно себя дискредитировала множественными статистическими аномалиями. Там, где официальная статистика более или менее достоверна, она коррелирует и с поисковыми запросами. Но корректнее всего оценивать именно госпитализации и смерти.
Сначала — поиск, потом — смерть
За весну и лето в России от коронавируса по данным оперштаба умерли 17 тысяч человек. Фактических же смертей с коронавирусом, очевидно, в разы больше. Об этом говорит, например, демограф Алексей Ракша, уволенный весной из Росстата после заявлений о фальсификации российской статистики. О несоответствии официальных цифр реальности заявлял и Росздравнадзор. Наконец, по данным Росстата, которые служба ежемесячно публикует, с апреля по август с коронавирусом умерло больше 45 тысяч человек.
Общая же избыточная смертность за этот период — 84,6 тыс. человек, если сравнивать с 2019 годом, и 72,5 тыс. в сравнении со средним за 2017−2019 годы. Это выше оперативных данных в 4,2−5 раз; для сравнения, в Италии и Великобритании разница официальной смертности и избыточной — в полтора раза, а в некоторых латиноамериканских странах (например, Перу) — в три раза.
Смертность от эпидемии корректно оценивать именно по избыточной смертности. Её максимальный прирост пришёлся на июнь−июль — сильно позже карантина, в месяцы, когда регионы сняли большинство ограничений. А из разборов смертности от московского Депздрава и петербургского Комздрава известно, что от 90 до 100% избыточной смертности приходится на коронавирус (не всегда он служит основной причиной смерти). По оценкам развитых стран, ковид определяет 60−100% избыточной смертности. Даже если показатель по регионам ниже, общий тренд избыточная смертность отражает: по данным Росстата, 55% избыточной смертности относится к ковиду.
И если запросы отражают распространение эпидемии, то они должны коррелировать и с избыточной смертностью в регионах: так и происходит.
Несколько примеров:
Москва. Пик запросов пришёлся на конец апреля−начало мая. Рекордная избыточная смертность (+58,5% к среднему за три года) — на май.
Татарстан. Пик запросов — вторая половина июня−начало июля. Рекорд по избыточной смертности (+50,5%) — июль.
Башкирия. Пик запросов — июль. Рекорд смертности (+48,8%) — июль.
Свердловская область. Бурный рост запросов весь июнь, пик — в июле. Рекордная смертность тоже в июле: +45,6%.
Самарская область. На пике запросов держится месяц: с середины июня по середину июля. На июль же приходится рекордная смертность: +36,6%.
Пензенская область. Пик запросов — с конца мая по середину июня, рекорд смертности (+34,6%) приходится на июнь.
Камчатский край. Выраженный пик запросов в середине июня, рекорд смертности (+46,3%) — также июнь.
И такая картина повсеместна. За резким ростом специфичных «ковидных» запросов следует прирост смертности, и его пик происходит, как правило, спустя 2−3 недели от пика запросов. Это соответствует реальному течению болезни: пропажа обоняния — часто один из ранних симптомов, а между заражением и смертью в среднем проходит 20−25 дней (что соответствует 2−3 неделям от первых симптомов до смерти). Исключение — северокавказские республики, где регистрация смертей происходила с сильным лагом (от 1 до 3 месяцев, в зависимости от региона), что связано, по всей видимости с местными особенностями учёта. Например, в Северной Осетии избыточная смертность в мае +43,6%, в июне резкое падение до −28,1%, в июле вновь резкий подъём до +54,5% — это в большей мере статистические аномалии, чем отражение реальной ситуации.
Как это выглядит на практике? Вот Москва. Сопоставление запросов и смертей за неделю. Здесь видно, как смерти следуют за запросами с двухнедельным сдвигом. А ещё видно, как с августа смерти перестают отражать динамику запросов.
Мэйдэй
Alexander Ku поделился
Познавательно
Инсайдер:
Вторая волна как девятый вал. Открытые данные говорят о катастрофической эпидемии в России
Александр Драган
26 октября 2020
Официальная российская коронавирусная статистика во время второй волны вызывает не меньше вопросов, чем во время первой. Например, в Санкт-Петербурге уже несколько недель ежедневное число выздоровевших ровно вдвое меньше числа заболевших. Но если реальные цифры можно скрыть, поисковые запросы людей — открытая информация, и они точно коррелируют с заболеваемостью, госпитализациями и смертями, выяснил маркетолог Александр Драган. Результаты анализа шокируют: уже к середине октября эпидемия, на этот раз накрывшая большую часть страны, была масштабнее весенне-летних пиков в 4 раза, а стандартного сезонного уровня — в 140 раз. Хуже всего ситуация в Сибири. Исследование помогает не только понять реальную картину, но и спрогнозировать загрузку больниц, ведь рост специфического запроса «пропало обоняние» опережает официальный рост заболеваемости.
Метод
Он прост и доступен каждому. У Яндекса есть Вордстат — инструмент, который позволяет смотреть помесячную или понедельную динамику показов по нужным поисковым запросам. И есть особые «коронавирусные» запросы, которыми с большей вероятностью будут пользоваться заболевший человек и его близкие. Как правило, это запросы максимально практичные: связаны либо с самыми специфичными симптомами ковида (такими, как пропажа обоняния и вкусов), либо с конкретными лекарствами, либо с диагностикой. Подробнее про метод можно почитать здесь и здесь. Главная идея — есть запросы, которые наиболее точно коррелируют с реальной заболеваемостью.
Эпидемия в России продолжается уже более полугода. И если поисковые запросы отражают реальный ход эпидемии, это легко проверить: достаточно сопоставить запросы с заболеваемостью, госпитализациями и смертями. Но выявленные случаи — недостаточно достоверный показатель, а официальная статистика ещё с весны вызывает вопросы и давно себя дискредитировала множественными статистическими аномалиями. Там, где официальная статистика более или менее достоверна, она коррелирует и с поисковыми запросами. Но корректнее всего оценивать именно госпитализации и смерти.
Сначала — поиск, потом — смерть
За весну и лето в России от коронавируса по данным оперштаба умерли 17 тысяч человек. Фактических же смертей с коронавирусом, очевидно, в разы больше. Об этом говорит, например, демограф Алексей Ракша, уволенный весной из Росстата после заявлений о фальсификации российской статистики. О несоответствии официальных цифр реальности заявлял и Росздравнадзор. Наконец, по данным Росстата, которые служба ежемесячно публикует, с апреля по август с коронавирусом умерло больше 45 тысяч человек.
Общая же избыточная смертность за этот период — 84,6 тыс. человек, если сравнивать с 2019 годом, и 72,5 тыс. в сравнении со средним за 2017−2019 годы. Это выше оперативных данных в 4,2−5 раз; для сравнения, в Италии и Великобритании разница официальной смертности и избыточной — в полтора раза, а в некоторых латиноамериканских странах (например, Перу) — в три раза.
Смертность от эпидемии корректно оценивать именно по избыточной смертности. Её максимальный прирост пришёлся на июнь−июль — сильно позже карантина, в месяцы, когда регионы сняли большинство ограничений. А из разборов смертности от московского Депздрава и петербургского Комздрава известно, что от 90 до 100% избыточной смертности приходится на коронавирус (не всегда он служит основной причиной смерти). По оценкам развитых стран, ковид определяет 60−100% избыточной смертности. Даже если показатель по регионам ниже, общий тренд избыточная смертность отражает: по данным Росстата, 55% избыточной смертности относится к ковиду.
И если запросы отражают распространение эпидемии, то они должны коррелировать и с избыточной смертностью в регионах: так и происходит.
Несколько примеров:
Москва. Пик запросов пришёлся на конец апреля−начало мая. Рекордная избыточная смертность (+58,5% к среднему за три года) — на май.
Татарстан. Пик запросов — вторая половина июня−начало июля. Рекорд по избыточной смертности (+50,5%) — июль.
Башкирия. Пик запросов — июль. Рекорд смертности (+48,8%) — июль.
Свердловская область. Бурный рост запросов весь июнь, пик — в июле. Рекордная смертность тоже в июле: +45,6%.
Самарская область. На пике запросов держится месяц: с середины июня по середину июля. На июль же приходится рекордная смертность: +36,6%.
Пензенская область. Пик запросов — с конца мая по середину июня, рекорд смертности (+34,6%) приходится на июнь.
Камчатский край. Выраженный пик запросов в середине июня, рекорд смертности (+46,3%) — также июнь.
И такая картина повсеместна. За резким ростом специфичных «ковидных» запросов следует прирост смертности, и его пик происходит, как правило, спустя 2−3 недели от пика запросов. Это соответствует реальному течению болезни: пропажа обоняния — часто один из ранних симптомов, а между заражением и смертью в среднем проходит 20−25 дней (что соответствует 2−3 неделям от первых симптомов до смерти). Исключение — северокавказские республики, где регистрация смертей происходила с сильным лагом (от 1 до 3 месяцев, в зависимости от региона), что связано, по всей видимости с местными особенностями учёта. Например, в Северной Осетии избыточная смертность в мае +43,6%, в июне резкое падение до −28,1%, в июле вновь резкий подъём до +54,5% — это в большей мере статистические аномалии, чем отражение реальной ситуации.
Как это выглядит на практике? Вот Москва. Сопоставление запросов и смертей за неделю. Здесь видно, как смерти следуют за запросами с двухнедельным сдвигом. А ещё видно, как с августа смерти перестают отражать динамику запросов.