新書推薦:
《
炙野(全2册)
》
售價:HK$
80.3
《
女人的胜利
》
售價:HK$
57.4
《
数据有道:数据分析+图论与网络+微课+Python编程(鸢尾花数学大系:从加减乘除到机器学习)
》
售價:HK$
273.7
《
500万次倾听:陪伤心的人聊聊
》
售價:HK$
55.2
《
英国商业500年(见证大国崛起与企业兴衰,启迪未来商业智慧。)
》
售價:HK$
82.8
《
万千心理·儿童心理治疗中的心智化:临床实践指导
》
售價:HK$
89.7
《
自我囚禁的人:完美主义的心理成因与自我松绑(破除你对完美主义的迷思,尝试打破自我评价过低与焦虑的恶性循环)
》
售價:HK$
67.9
《
周易
》
售價:HK$
45.8
|
編輯推薦: |
从海量的大数据中筛选出真正的信号,“黑天鹅”事件也可提前预知!
统计学或预测是让很多人望而却步的话题,而本书就是关于这个话题的一本有趣的普及读物,棒球比赛、职业扑克牌手、政治选举等例子足以勾起读者的好奇心,甚至会让他们废寝忘食地阅读,而且其中潜藏着帮你做出正确预测的能量。
在大数据时代作预测可能跟你想象的完全不同。这本观点新鲜且原创的书,为我们区分关于未来的预测中哪些是主观现实、哪些是客观现实,哪些是干扰预测的噪声、哪些是有价值的信号,提供了意想不到的启发性视角。作者还指出,只要我们明智地从糟糕的预测中吸取教训,那我们一定会在科学、技术和政治的预测方面取得进步。
这本书与畅销书《黑天鹅》的观点有异曲同工之妙。西尔弗认为,人类对自己的预测能力往往过度自信,以至于他们排斥用概率的方法思考问题,也不允许自己的预测模型中存在不确定性。
本书将带给我们一场睿智的、优雅的、科学与艺术交叉的预测之旅,它将是未来10年最重要的书籍之一。对于每一个关心下一刻可能会发生什么的人来说,这都是本必读书。
|
內容簡介: |
《信号与噪声》中涉及如下有趣又值得研究的问题:天气预报说降水概率为60%,你出门会带伞吗?被雷电击中的概率到底有多大?地震发生之前,我们真的无法预测吗?中情局为什么会忽略“9.11”恐怖袭击发生的信号?禽流感为何会突然爆发,又突然消失?为什么大数据时代的预测更容易失败?“信号”是我们想要和需要的事实,比如能帮助我们侦破早期鞋子炸弹案的信号。“噪声”则是另一回事,通常是不相干的信息,它阻碍或误导我们搜索信号。
人类每时每刻都需要对未来进行预测并制定相应的策略,如此国家、企业乃至个体才能持续发展,因此我们对于“下一刻会发生什么”倍加关注。
在信息爆炸的大数据时代,随着我们的生活节奏变得越来越快,我们所要做出的预测的速度和数量都在不断增加。一个不容忽视的事实是,现实世界中的很多预测都失败了,由此付出了巨大的社会代价。“9.11”恐怖袭击事件、2008年金融危机、卡特里娜飓风、2011年日本大地震、禽流感肆虐,这些“黑天鹅”事件的发生在很大程度上应归咎于糟糕的预测,也就是说预测者们被众多信息中的噪声干扰,而忽视了其中真正的信号。
作者最为美国最具影响力的预测专家之一,检视了从飓风到地震、从经济到股市、从NBA到政治选举在内的众多领域的预测事例,旨在回答一个问题:如何才能从繁杂的海量数据中筛选出真正的信号,摒弃噪声的干扰,从而做出接近真相的预测。
真正优秀的预测者会用概率的方法思考问题,他们谦虚而且勤恳,他们能清楚地区分什么是不可预测的、什么是可预测的,他们注重能带领他们接近真相的成千上百个小细节,他们能辨识出什么是噪声、什么是信号。
从全球经济的健康到战胜恐怖主义,都依靠预测的质量。《信号与噪声》可以给你想要的答案。
|
關於作者: |
纳特·西尔弗,统计学家、作家和《纽约时报》政治性网站538.com的创始人。2008年美国大选期间他成功预测出49个州的选举结果,2012年大选期间更是成功预测出全部50个州的选举结果,被称为“神奇小子”。2009年,《时代》周刊将他评选为全球100位最具影响力的人物之一。
|
目錄:
|
引 言 XIII
第一章 预测失败的灾难性后果
一场错误预测引发的悲剧
他们只是不想让“音乐”停下来罢了
评级机构为什么会犯下致命的错误?
第一幕:房地产泡沫
第二幕:负债经营
幕间休息:从贪婪到恐惧
第三幕:这次还是犯了同样的错误
失败的预测都是非样本预测
失败预测的公式——非样本,无思考
前事不忘,后事之师
第二章 政治选举预测:狐狸和刺猬,谁更聪明?
政治学家是名副其实还是徒有虚名?
狐狸型专家:善于变通,更善于做出准确的预测
刺猬型专家更适合做电视节目嘉宾
政治预测为什么常常失败?
狐狸型预测方法
原则一:用概率的方法思考问题
原则二:今天的预测是你以后人生的第一个预测
原则三:寻求共识
定性信息与定量信息同等重要
做出客观的预测并非易事
第三章 棒球比赛预测:球探和数据怪才,谁更胜一筹?
构建棒球比赛的预测系统
全世界最丰富的统计数据库
老化曲线与相似分数
球探与数据怪才的矛盾冲突
系统与球探的对决:球探赢了
球探和数据怪才的偏见
生理指标与心理指标
信息是决定预测成败的关键
并不是信息越多,预测就越成功
《点球成金》的真正意义
第四章 天气预测:蝴蝶扇动翅膀,有可能引起龙卷风
我们真能准确地预测天气吗?
气象预报简史
用矩阵来预测天气
混沌理论与蝴蝶效应
视觉化预测与抽象化预测
被雷电击中的概率越来越小了
什么样的预测才算是好预测?
商业竞争如何使预测变得更糟糕?
天气预报说降水概率为%,你出门会带伞吗?
尽可能地做出准确预测
第五章 地震预测:一个困惑了人类 年的难题
地震可以预测吗?
“圣杯”根本就不存在
我们对于地震的了解
究竟是信号还是噪声?
那些以失败收场的地震预测
过度拟合模型:将噪声误认为信号
年日本大地震引发的思考
地震震级的上限是多少?
被审判的预测科学
第六章 经济预测: 经济学家为什么没有预测到 年经济危机?
不可忽视预测中的不确定性
经济学家都是理性的吗?
相关的两个经济变量未必互为因果
变化莫测的经济
经济数据中充满噪声
经济是一个动态系统,不是一个方程式
经济预测中不可避免地会存在偏见
克服预测偏见的两种选择
第七章 传染性疾病预测:禽流感为何会突然爆发,又突然消失?
人们又一次高估了HN 的致命率
外推法的危害——艾滋病感染人数被低估了一半
为什么 年的流感预测会失败?
自我实现预测与自我否定预测
预测模型越简单越好,还是越复杂越好?
所有的预测都失败了
预测是为了让损失最小化
第八章 贝叶斯定理:只有正确的预测才能让我们更接近真相
成功的赌客是如何思考问题的?
贝叶斯留下的宝贵遗产
概率、预测与科学进步
简单的运算推导出重大的预测
为什么大数据时代的预测更容易失败?
当统计数据偏离了贝叶斯定理
成功践行贝叶斯定理的体育赌客
通往真理的贝叶斯之路
第九章 国际象棋大战:计算机与人类的智能博弈
国际象棋的人机大战
国际象棋比赛预测和启发法
开局阶段:独立思考能力更重要
中局阶段:宽度与深度的两难选择
残局阶段:计算机能力方面的较量
计算机战胜了人类
国际象棋大师为何败给了“深蓝”计算机?
计算机擅长做什么?
用试错法提高计算机的预测能力
克服人类的技术盲点
第十章 扑克牌游戏:如何从 种组合中猜出对手的底牌?
是心理游戏,也是数学游戏
出色的扑克牌玩家如何读出对手的牌?
是弃牌还是跟注,如何选择?
虚张声势,让对手猜不出你的底牌
学习曲线与二八原则亦适用于预测领域
扑克牌经济的繁荣
扑克牌经济泡沫的破灭
既靠运气也拼技能
我们对于扑克牌游戏的妄想
以过程而不是结果为导向
第十一章 股票市场:非理性交易者的存在让价格泡沫不可避免
贝叶斯定理世界中的价码牌
预测市场中的“无形的手”
群体预测往往优于个体预测
有效市场假说理论的缘起
过去的表现不代表未来的结果
技术分析法并不能预测股市
有效市场假说的 种形式
追涨杀跌的股市投资策略真能获利吗?
当有效市场假说遇到非理性繁荣
羊群效应催生股市泡沫
过度自信的投资者逃不开“赢家的诅咒”
股市泡沫需要很长时间才能被挤出
有时,价格的确是错误的!
金融市场中的噪声
直觉判断让投资者深陷“高买低卖”的误区
有没有可能预测到市场泡沫的出现?
第十二章 温室效应:未来 年,全球气温会上升还是下降?
温室效应真会导致全球气温变暖吗?
温室效应假说的 种怀疑论
对“全球气温会持续升高”预测的批判
达成共识的预测结果
不能把所有鸡蛋都放在一个篮子里
气候科学不是“火箭科学”
模型越复杂,预测越糟糕
气候预测中的 类不确定性
评判气候预测准确性的时刻到了
“全球变冷”事件的教训
正确的预测绝对离不开科学的方法
气温变化趋势的真相
政治与科学的针锋相对
第十三章 恐怖主义: 比“?”更严重的恐怖袭击事件会发生吗?
信号无处不在
你不知道的不代表不会发生
“?”恐怖袭击事件是“已知的未知”?
用数学的方法研究恐怖主义
用统计学的方法测量恐怖主义
级恐怖袭击很可能会发生
为什么恐怖分子不去炸购物中心?
如何辨识恐怖袭击的信号?
结束语
致 谢
|
內容試閱:
|
经济预测中不可避免地会存在偏见
如果你想进行经济预测,最好的选择就是查看平均预测或群体预测,而不是求助于某个经济学家。我对“调查”的研究显示,群体预测总是比个体预测更准确,在预测GDP增长、失业率和通货膨胀这三个方面,群体预测比个体预测的准确率分别高出20%、10%和30%。通过研究许多领域的预测结果,人们发现几乎所有的群体预测都优于个体预测。
然而,虽说群体预测优于个体预测这一观念已成为重要的经验性规律,可是当预测与事实有很大的出入时,这一观念有时就会成为蹩脚的借口。群体预测是由个体预测组成的,如果个体预测的质量提高了,群体预测的质量也会提高。另外,在现实生活中,经济群体预测的质量也很差劲儿,所以还有很大的提升空间。
大多数经济学家作预测时,会在一定程度上依赖自己的判断,而不是依据统计模型输出的信息进行预测。考虑到数据是那么杂乱,这种做法或许是有益的。波士顿联储前副总裁斯蒂芬?K?
麦克内斯曾经进行过一项研究,他发现根据统计学预测方法对人为的判断进行调整会使预测的准确率提高约15%。20
世纪七八十年代计算机开始广泛使用时,人们普遍认为统计模型能够“解决”经济预测问题。但是,改进的技术无法掩盖对经济领域理论认识的缺乏,只会让经济学家更加快速、更加煞费苦心地将噪声误认为是信号。看似前景不错的预测模型在某些方面一败涂地,最后惨遭淘汰。在其他领域,比如那一时期的地震预测,也会遭遇这样的状况。
援引某个人为判断也会带来潜在的偏见。人们在进行预测时,会倾向于使预测满足自己的经济动机或政治信仰。人们或许太过自负,即使事实和环境要求他做出改变,他也不愿对自己的预测进行修正。哈祖斯告诉我:“我认为人们绝对有这样的倾向,急切地希望事情能按照自己希望的方式发展下去。”
是否有经济学家更擅长把握这种权衡的度?预测出上一次经济衰退的经济学家是不是也可以预测出下一次经济衰退?这个问题有一个非常有趣的答案。
用于评判预测技能的统计测试,在应用于“调查”时给出了否定的结果。也就是说,从这份调查中,人们似乎找不到证据证明某些经济学家总是比其他同行出色。然而,对另一个小组——“蓝筹经济调查报告”——的研究却总能给出肯定的结果。经济预测中显然少不了运气的成分,暴躁或是顽固的经济学家偶尔也会做出正确预测。但是对“蓝筹经济调查报告”的多项研究发现,长期来看,某些经济学家似乎确实要比其他同行略胜一筹。
这两份调查有什么不同呢?“专业预测人员情况调查”是匿名操作的:每位经济学家随机分配一个身份标识号码,他们在不同的调查中会一直使用这个号码,但是不会暴露自己的身份和职业。而在
“蓝筹预测调查报告”中,每个人的预测都标有其姓名和曾经获得的荣誉。
当预测结果标有自己的名字时,你的动机就会发生改变。比如,如果你在一家名不见经传的小公司工作,你的那些大胆预测就会备受重视,不管这个预测是准确的还是离谱的,你都会受人关注,这是合情合理的。而像高盛这样的大公司,为了能达成一致意见,预测反而会比较保守。
事实上,在“蓝筹经济调查报告”中,已经发现了这个特点:名气越小,作预测时就越不怕冒险。一项研究把这一现象称为“合理偏见”。即使知道这个预测十分冒险,你还是会为“大比分”放手一搏,这样做是可以理解的。反过来,如果你已经声名鹊起,即便自己手头的数据要求你做出大胆的预测,你可能也不愿意做出过于大胆的预测。
这两种对声誉的关注都有可能使你远离做出最诚实、最准确的预测这一目标,甚至还会使群体预测更加糟糕。整体来看,在对GDP增长率和失业率的预测上,“专业预测人员情况调查”的匿名参与者略优于参与“蓝筹经济调查”的那些名誉至上的受访者。
2011 年日本大地震引发的思考
将噪声误认为信号的倾向,有时会给现实世界带来极可怕的后果。在日本,尽管地震活动极其频繁,但2011
年那次灾难性的地震还是让这个国家措手不及。福岛核反应堆是按照可抵御8.6 级地震的标准设计的,无法承受震级高达9.1
级的地震。考古资料表明,2011 年由地震引发的约40
米高的海浪在历史上曾经引发过多次海啸,但这次人们明显忘记了或者根本无视这些惨痛的案例。
9.1 级地震在全世界都很少见,没人能确切地预测到这样的地震会发生在哪个10
年里,更不用说具体的日期了。而在日本,一些科学家和中央计划员却排除了近期发生地震的可能性。这一点就反映了日本的地震预测模型是过度拟合模型。
在图5–6A中,我画出了2011 年日本福岛地震震中附近发生地震的历史频率。这些数据中的地震级别逐渐加大,却没有达到3 月11
日的9.1 级。通过看图你会发现,数据几乎遵循着古登堡– 里克特法则的那种直线预测模型,然而,在7.5
级处出现了一个拐点,而且,该地区自从1964 年发生了一场震级达8.0
级的地震后,再没有发生过震级更大的地震,于是,这条线似乎开始向下弯曲了。
究竟该如何连接这些数据点呢?如果严格依据古登堡–
里克特法则,就要忽略图像中的拐点,沿直线将数据点连接起来,如图5–6B所示。若是按地震学家口中的“特性拟合”法(见图5–6C),即描述这一地区地震发生的历史频率,那么,就会把那个拐点当成是真实情况,十分肯定这一地区发生7.6
级以上地震的可能性不大。
看似无害的决定,却会导致大相径庭的结果,从日本福岛的例子来看,不同的选择会关系到是否认为这一地区会发生9.1
级大地震。特性拟合模型暗示9.1 级地震需要约13 000
年才可能发生一次,这样看来,这一地区几乎就不可能发生这样大级别的地震。另外,古登堡– 里克特法则却预测,9.1 级地震平均每300
年才可以预见一次,确实不常见,但也不是绝无可能,风险还是存在的,而像日本这样富有的国家,是能够为此作好准备的。
最近,特性拟合模型和日本东北部地区的地震记录拟合得更加紧密了。但是正如我们所知,完全吻合未必就是一件好事,很有可能会变成过度拟合模型,而且,在匹配真实关系时,这种模型会表现得更糟。
在这种情况下,过度拟合的模型会严重低估这一地区发生灾难性大地震的可能性。特性拟合的问题就在于它依靠的是十分微弱的信号。之前提到,日本福岛地震发生前的45
年内,日本东北部地区从未发生过8 级及以上的地震。然而,这些都还只是以稀有事件为开端的事例:古登堡–
里克特法则预测日本东北部地区约30 年才会发生一次稀有事件,而30 年一遇的事件拖到45
年的时候发生也没什么稀奇,就算没有发生,也不奇怪。就好比一个击球率达0.300 的击球手,某天状态不好,输赢比达到了5 ∶
0,这也不足为奇。另外,日本东北部地区发生过好几次中等级别达到7.0
级的地震,当世界其他地区出现类似情况时,常预示着会有更大级别的地震发生,那又有什么理由认为日本东北部地区会是个特例呢?
实际上,日本以及其他地区的地震学家为此做出了合理解释。比如,他们表明该区域的海底构造特殊、年代久远、温度相对较低且密度较大,能够阻止这样的大地震形成。另一些地震学家则观察到2004
年以前,这种类型的海底从来没有发生过9 级地震。
这类结论有点儿像认定了某个来自宾夕法尼亚的家伙不可能会中彩票的头等奖,因为过去的3 周无人获此大奖。9
级地震就像彩票头奖,中奖人数少,时间间隔长。实际上,2004 年之前,全世界有记载的9 级地震总共才发生3 次。9
级地震究竟在何种情形下才会发生,关于这个问题,没有足够的数据来支撑高度具体的结论。日本不是这一模型失败的首例,苏门答腊岛也遇到过相似的问题。有一段时间,苏门答腊岛发生了一系列震级达到7
级的地震,随后却并没有发生更大级别的地震。但在2004 年12 月,一场震级达9.2 级的特大地震袭击了苏门答腊岛。
古登堡–
里克特法则并不能预测地震的具体时间,无论是苏门答腊岛地震还日本福岛地震都是这样,但是这一法则考虑到了发生地震的概率。目前,许多更精细的地震预测活动都失败了,古登堡–
里克特法则的表现都还不错。
|
|