navlasov (navlasov) wrote,
navlasov
navlasov

Category:

Грибы и статистика

В своей ленте новостей в очередной раз наткнулся на рассуждения из серии "показатель Х вырос в январе 2021 года по сравнению с январем 2020 года на 10%, следовательно...". И в очередной раз подумал о том, что анализ статистики нужно обязательно включить в базовую школьную программу. Чтобы авторы подобных рассуждений хоть немного задумывались, прежде чем что-то писать.

Я не раз затрагивал эту тему в своем ЖЖ, но, как показывает практика, переборщить в данном случае просто невозможно. Поэтому возвращаемся к азам.

Допустим, в последние выходные августа 2019 года я собрал в лесу 8 белых грибов и 11 красных, а в последние выходные августа 2020 года в том же самом лесу - уже 19 белых и 28 красных. Какой вывод из этого можно сделать?

Стандартный вариант - "2020 год был значительно более грибным, чем 2019".
Продвинутый вариант - "В конце августа 2020 года грибов в этом конкретном лесу было намного больше, чем в конце августа 2019 года".

Я не хочу сказать, что эти выводы (и первый, и тем более второй) обязательно неверные. Но оба они неявно подразумевают, что условия 2019 и 2020 года были абсолютно идентичны. А это не всегда так - я бы даже сказал, что это почти всегда не так.

Давайте посмотрим, как поменяется ситуация, если я добавлю одну - или сразу несколько - дополнительных вводных:
- В 2019 году я ходил по лесу всего два часа, потому что слишком легко оделся, замерз и вдобавок пошел сильный дождь. В 2020 году погода была просто отличной, и я провел в лесу шесть часов.
- В 2019 году я был в этом лесу впервые. А в 2020 сразу же пошел на те места, где год назад набрал больше всего грибов. А потом пошел через болотинку, куда в 2019 году не полез. За этой болотинкой я и нашел основную массу грибов, потому что другие грибники туда не добрались.
- В 2019 году я придирчиво выбирал грибы. В 2020 хватал все подряд, не глядя - дома разберусь.
- В 2019 году у меня были большие проблемы, и я ходил по лесу, постоянно думая о них и практически не глядя себе под ноги. В 2020 - отличное настроение и полная концентрация на том, что я делаю.

Согласитесь, если добавить хотя бы один из этих пунктов, скоропалительный вывод сразу же покажется блеклым и неубедительным. Именно поэтому при анализе статистики важно задаться вопросом о том, не было ли в данном случае неких дополнительных факторов, которые оказали решающее влияние на результат - и только потом делать выводы.
Tags: критическое мышление
Subscribe

  • Пропаганда и потребности

    Часто вижу тезис: «Пропаганда говорит только то, что люди и так хотят слышать». Так ли это? И да, и нет. Давайте разберемся. Начнем с того, что у…

  • Спускаясь с пирамиды

    Такое явление, как зависимость от однажды избранного пути (path dependency) хорошо известно и возникает в совершенно разных сферах. Часто, вступив на…

  • Шаг за шагом

    «Почему евреи позволяли нацистам себя уничтожать?» Вопрос настолько избитый, что в приличном обществе считается неуместным его задавать. И все же:…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

  • 92 comments

  • Пропаганда и потребности

    Часто вижу тезис: «Пропаганда говорит только то, что люди и так хотят слышать». Так ли это? И да, и нет. Давайте разберемся. Начнем с того, что у…

  • Спускаясь с пирамиды

    Такое явление, как зависимость от однажды избранного пути (path dependency) хорошо известно и возникает в совершенно разных сферах. Часто, вступив на…

  • Шаг за шагом

    «Почему евреи позволяли нацистам себя уничтожать?» Вопрос настолько избитый, что в приличном обществе считается неуместным его задавать. И все же:…