Цитаты по тегу статистика

Каждый день в США умирает 10 тысяч человек. По статистике, каждый житель большого города за день встречает до двух человек, которые к концу дня умрут.
Статистика для политика — всё равно, что уличный фонарь для пьяного забулдыги: скорее опора, чем освещение.
По какой статистике?! Причём здесь статистика?! По статистике, 80% больных раком поджелудочной умирают в течение 5 лет, 95% аппендэктомии проходят без осложнений. Мы видели раковых больных, которые выжили, и пациентов с аппендицитом, которые умерли. Статистика не имеет отношения к конкретной жизни. Либо ты будешь хорошим отцом, либо не будешь. В конце концов твои родители развелись, а ты ухитрился стать относительно неплохим врачом.
Булю показал мне удивительную исследовательскую работу, только что законченную его практикантом и уже принятую к публикации; в ней подробно рассматривались две тысячи предсказаний, сделанных аналитиками ценных бумаг. В работе наглядно показывалось, что эти брокер-аналитики не предсказывали ничего: наивный прогноз человека, просто переносящего цифры из истекшего периода в следующий, был бы немногим хуже. А ведь аналитики владеют информацией о заказах, грядущих контрактах и планируемых расходах и благодаря этим ценным знаниям вроде должны прогнозировать значительно лучше, чем наш наивный предсказатель, не располагающий никакой информацией, кроме прошлых данных. Хуже того, разрыв между предсказанными и реальными величинами был гораздо существенней, чем между разными прогнозами, а значит, аналитиками руководил стадный инстинкт. Иначе прогнозы отстояли бы друг от друга настолько же, насколько они отстоят от реальности.
Тетлок изучал проблему «экспертов» в политике и экономике. Он просил специалистов из разных областей оценить вероятность того, что в течение заданного временного периода (около пяти лет) произойдут определенные политические, экономические и военные события. На выходе он получил около двадцати семи тысяч предсказаний почти от трех сотен специалистов. Экономисты составляли около четверти выборки. Исследование показало, что эксперты далеко вышли за пределы своих допусков на ошибку. Обнаружилась и экспертная проблема: между результатами докторов наук и студентов не было разницы. Профессора, имеющие большой список публикаций, справлялись не лучше журналистов. Единственной закономерностью, которую обнаружил Тетлок, была обратная зависимость прогноза от репутации: обладатели громкого имени предсказывали хуже, чем те, кто им не обзавелся.
Но Тетлок ставил перед собой задачу не столько показать, чего реально стоят эксперты (хотя у него это замечательно получилось), сколько выяснить, почему до них никак не доходит, что они плохо справляются со своей работой, иными словами, как им удается «втирать себе очки».
<...>
Вы говорите, что играли в другую игру. Допустим, вам не удалось предсказать неожиданный крах Советского Союза (этого не предвидел ни один социолог). Легко заявить, что вы прекрасно понимали суть политических процессов, происходивших в Советском Союзе, но эти русские, будучи чрезмерно русскими, искусно скрыли от вас существенные экономические составляющие. Если бы вы обладали этими экономическими данными, вы бы уж конечно смогли предсказать падение советского режима. Винить надо не вашу квалификацию. Так же можно действовать, если вы предсказали решительную победу Эла Гора над Джорджем У. Бушем. Вы не знали, что экономика в таком отчаянном положении; собственно, этот факт, кажется, был тайной для всех. Вы же не экономист, а борьба-то, оказывается, шла на экономическом ринге.
Вы валите все на непредвиденные обстоятельства. Случилось что-то необычайное, лежащее вне поля вашей науки. Поскольку это нельзя было предсказать, вы не виноваты. Это был Черный лебедь, а вы не обязаны предсказывать Черных лебедей.
В 1971 году психологи Дэнни Канеман и Амос Тверски решили помучить профессоров статистики вопросами, сформулированными не как статистические вопросы. Один был приблизительно таков (для большей ясности я поменял пример): представьте, что вы живете в городе, где есть две больницы — одна большая, другая маленькая. В определенный день в одной из этих двух больниц рождается 60 процентов мальчиков. В какой больнице это скорее могло бы произойти? Многие профессора делали ошибку (во время обычной беседы), называя большую больницу, в то время как суть статистики заключается в том, что большие выборки более стабильны и имеют меньше отклонений от долгосрочного среднего показателя (в нашем случае 50 процентов каждого пола), чем маленькие выборки. Эти профессора провалили бы экзамены, которые сами же принимают. Еще работая квант-инженером, я выявил сотни таких серьезных ошибок, сделанных статистиками, забывшими о том, что они статистики.
Психологи Канеман и Тверски <...> провели такой эксперимент: испытуемых (а это были люди, чья профессия связана с составлением прогнозов) просили оценить вероятность двух событий:
а) в Америке случится сильное наводнение, в результате которого погибнет более тысячи человек;
б) землетрясение в Калифорнии вызовет сильное наводнение, в результате которого погибнет более тысячи человек.
По мнению респондентов, первый вариант менее вероятен, чем второй: ведь землетрясение в Калифорнии — это причина, которую легко допустить и которая делает ситуацию наводнения более представимой, тем самым повышая ее вероятность в наших глазах.
Точно так же, если я спрошу: «Как вам кажется, сколько ваших сограждан больны раком легких?» — вы назовете какую-нибудь цифру (ну, скажем, полмиллиона). Однако если я спрошу, сколько человек в вашей стране заболели раком легких в результате курения, цифра, которую вы назовете, окажется гораздо (пожалуй, что и в два-три раза) больше. Если указана причина явления, это явление выглядит куда более правдоподобным — и куда более вероятным. В рак от курения верится легче, чем в рак без причины (если причина неясна, это все равно, что ее нет).
Какая из этих ситуаций, на ваш взгляд, более вероятна?
1. Джой, судя по всему, был счастлив в браке. Он убил свою жену.
2. Джой, судя по всему, был счастлив в браке. Он убил свою жену, чтобы завладеть ее наследством.
Наверняка, повинуясь первому впечатлению, вы скажете, что вероятнее второй вариант, хотя это чистой воды логическая ошибка, ведь первое утверждение шире и охватывает не одну возможную причину, а множество: Джой убил свою жену, потому что сошел с ума, или потому, что та изменила ему с почтальоном и лыжным инструктором, или потому, что в состоянии помрачения он принял ее за специалиста по финансовому прогнозированию.
Канеман и Тверски заметили, что люди способны всерьез задуматься о, казалось бы, маловероятных явлениях, если вовлечь их в обсуждение подобных явлений и дать почувствовать, что эти события не так уж нереальны. Например, если спросить человека, какова вероятность гибели в авиакатастрофе, он, скорее всего, завысит цифру.
Грег Баррон и Идо Эрев в ходе ряда опытов установили, что люди склонны преуменьшать малую вероятность, если им самим приходится ее просчитывать, то есть если она не обозначена в цифрах. Представьте, что вы тянете шары из урны, в которой очень мало красных и много черных шаров, и вам нужно угадать, какого цвета шар вы сейчас вытащите; при этом вы не знаете точного соотношения красных и черных. Скорее всего, по вашей оценке, вероятность вытащить красный шар окажется ниже, чем она есть на самом деле. А вот если вам сказать, к примеру, что красных шаров — 3 процента, вы, наоборот, будете ошибаться, говоря «красный» чаще, чем нужно.
Как и многие биологические переменные, ожидаемая продолжительность жизни — величина среднестанская, то есть подчинена рядовой случайности. Она не масштабируема, так как чем старше мы становимся, тем меньше у нас шансов жить дальше. В развитой стране таблицы страховых компаний предсказывают новорожденной девочке смерть в 79 лет. Когда она справит 79-й день рождения, ожидаемая продолжительность ее жизни в типичном случае будет составлять 10 лет. В возрасте 90 лет она сможет рассчитывать на 4,7 года.
В 100 лет — на 2,5 года. Если она чудесным образом доживет до 119 лет, ей останется около 9 месяцев. По мере того как она пересекает очередные пороги, количество дополнительных лет уменьшается. Это иллюстрация главного свойства случайных переменных, описываемых «гауссовой кривой». Чем старше человек, тем меньше дополнительных лет у него в резерве.
С человеческими планами и проектами дело обстоит по-другому. Они часто масштабируемы, как я уже говорил в главе 3. А в случае с масштабируемыми, то есть крайнестанскими, переменными вы получите ровно противоположный эффект. Скажем, предполагается, что проект будет завершен за 79 дней (берем ту же цифру, что в примере с возрастом женщины). Если на 79-й день проект не завершен, нужно будет отвести на него еще 25 дней. На 90-й день — еще около 58. На 100-й — 89. На 119-й —149. Если проект еще не завершен в день номер 600, то на него понадобится 1590 дополнительных дней. Как видно, чем дольше вы ждете, тем дольше вам предстоит ждать.
«Если верить статистике? Ты прожил на земле уже почти двадцать лет и статистика – это лучший ответ, который ты способен придумать?» — Она изогнула бровь с явной издевкой и фыркнула на меня. «Только не говори, что ты веришь во что-то настолько дурацкое. То, что случается лишь один раз на сотню тысяч попыток, происходит при самой первой попытке. Первый же человек, попавшийся тебе на пути – тот самый, один из миллиона. Чем ниже вероятность, тем чаще ты с этим сталкиваешься. Ага, «статистика». Что за ерунда. Нет ничего более обыденного, чем чудо».
Странно. Девяноста пяти процентам людей я не могу сказать правду, потому что они ее не поймут или обидятся. И девяносто пять процентов людей никогда не говорят правды мне, потому что обижусь я. И сам себе я в десяти случаях из ста не могу сказать правду, потому что мне будет страшно.
– У беднейшей половины мира столько же денег, сколько у восьмидесяти пяти самых богатых людей. Вы знаете об этом?
– Разумеется, да. – В голосе Фредди слышалось раздражение. – Это было во всех газетах. Бессмысленная статистика.
– Бессмысленная? Разве она не заставляет задуматься?
– Я и задумываюсь – о том, что беднейшей половине мира пора бы наконец взяться за ум.
Общая денежная масса в мире в 2006 году составляла $473 триллиона, но на долю монет и банкнот приходится менее $47 триллионов. Более 90% всех денег — свыше 400 триллионов на счетах — существует лишь на компьютерных серверах. Для выплаты крупных сумм никто не использует банкноты или монеты. Только член преступной группировки покупает дом за чемодан банкнот.
Статистика, в чем рано убедилась Дженни, теряет всякий смысл, когда дело касается тебя самого, пусть ты оказываешься тем единственным человеком из тысячи, кого поразила молния, или той самой девочкой, чей отец не придет домой, — и неважно, разбился ли он в машине на скользкой дороге или сидит в тюремной камере.
—  ... Выходит, ты кто?
— Как кто? — не понял штрафник Веретенников. — Человек.
— Не, ты не человек. Ты — статистика, — торжественно заключил политический Авдеев, и все вокруг радостно заржали. Авдеев оглядел смеющиеся небритые чумазые рожи и добавил: — Мы все здесь — статистика…
Статистика — это такая вещь, с которой никогда ничего заранее не скажешь; иной раз она, как болезнь, таится много лет, а потом вдруг разит насмерть; а иная статистика бросается на тебя сразу, как атакующий бизон.
— Пацаны, я тут кое-что подсчитал. В прошлом году соотношение составляло 90% белых против 10% черноты. Это означает, что всего за один год их стало на 50% больше.
 — Первый раз ты так серьезно математикой.
 — Потому-что это важно! Ежегодный прирост в 50% означает, что через 3 года мир заполонят одни нацменьшинства! Это случится в 2012 году. Индейцы Майя это предсказывали!
 — Кто?
 — Майя. Они знали, что к 2012 году чернота захватит мир! И это уже началось.
Массы представляются мне достойными внимания только в трёх отношениях: прежде всего, как плохие копии великих людей, изготовленные на плохой бумаге со стёртых негативов, затем, как противодействие великим людям и, наконец, как орудие великих людей; в остальном же побери их чёрт и статистика!
Если мой сосед бьет свою жену ежедневно, а я — никогда, то в свете статистики мы оба бьем свою жену через день.