Я не раз затрагивал эту тему в своем ЖЖ, но, как показывает практика, переборщить в данном случае просто невозможно. Поэтому возвращаемся к азам.
Допустим, в последние выходные августа 2019 года я собрал в лесу 8 белых грибов и 11 красных, а в последние выходные августа 2020 года в том же самом лесу - уже 19 белых и 28 красных. Какой вывод из этого можно сделать?
Стандартный вариант - "2020 год был значительно более грибным, чем 2019".
Продвинутый вариант - "В конце августа 2020 года грибов в этом конкретном лесу было намного больше, чем в конце августа 2019 года".
Я не хочу сказать, что эти выводы (и первый, и тем более второй) обязательно неверные. Но оба они неявно подразумевают, что условия 2019 и 2020 года были абсолютно идентичны. А это не всегда так - я бы даже сказал, что это почти всегда не так.
Давайте посмотрим, как поменяется ситуация, если я добавлю одну - или сразу несколько - дополнительных вводных:
- В 2019 году я ходил по лесу всего два часа, потому что слишком легко оделся, замерз и вдобавок пошел сильный дождь. В 2020 году погода была просто отличной, и я провел в лесу шесть часов.
- В 2019 году я был в этом лесу впервые. А в 2020 сразу же пошел на те места, где год назад набрал больше всего грибов. А потом пошел через болотинку, куда в 2019 году не полез. За этой болотинкой я и нашел основную массу грибов, потому что другие грибники туда не добрались.
- В 2019 году я придирчиво выбирал грибы. В 2020 хватал все подряд, не глядя - дома разберусь.
- В 2019 году у меня были большие проблемы, и я ходил по лесу, постоянно думая о них и практически не глядя себе под ноги. В 2020 - отличное настроение и полная концентрация на том, что я делаю.
Согласитесь, если добавить хотя бы один из этих пунктов, скоропалительный вывод сразу же покажется блеклым и неубедительным. Именно поэтому при анализе статистики важно задаться вопросом о том, не было ли в данном случае неких дополнительных факторов, которые оказали решающее влияние на результат - и только потом делать выводы.