Как нас дурачат статистикой
Давайте поиграем и подумаем о том, как мы пользуемся статистикой
Из достаточно большой емкости, наполненной поровну белыми и красными шариками будем вытаскивать сразу по 4 шара, записывать результат и бросать их обратно. Если повторить это достаточно много раз, то выборки, где все шары одного цвета встретятся в 7 раз реже прочих:
(0,5^4)*2=0,125 – это 12,5% или 1/8.
1/8 – это вероятность экстремума (пикового значения) в данном эксперименте.
Если выборку увеличить всего в 2 раза и начать вытаскивать по 8 шаров, то частота экстремумов сократиться в 16 раз!
(0,5^8)*2=0,0078125 – это 0,78% или 1/128.
При таком придуманном эксперименте становится ясна «сила» малых выборок – они чаще дают пиковые значения. Парадокс, что, забывая об этой силе, в жизни мы часто делаем неправильные выводы. Точнее, умелые манипуляторы нам эти выводы навязывают:
➢Большинство населенных пунктов с самой НИЗКОЙ заболеваемостью раком почек – сельская местность. Ага! Свежий воздух, экологически чистое питание сказываются
➢Большинство населенных пунктов с самой ВЫСОКОЙ заболеваемостью раком почек – сельская местность. Логично! Плохая медицина, жирные продукты, много алкоголя и табака.
А может, все дело в величине выборки, то есть в малом количестве жителей в населенных пунктах, называемых сельской местностью.
➢Большинство школ с максимальным средним баллом по ЕГЭ – маленькие школы! Давайте развивать маленькие школы! Строить новые, дробить старые!
➢Большинство проблем с HDD у меня и моих знакомых были с дисками WD. А у других то же самое, но с Seagate. Значит, одним нельзя покупать WD, а другим – Seagate! :))
Все перечисленное может иметь практические последствия.
Узнаете нашу суровую реальность?
Оставить заявку на консультацию, чтобы задать любые вопросы, можно в форме ниже