新書推薦:

《
竞争法解读与应用(法律法规新解读·全新升级第5版)
》
售價:HK$
39.6

《
梁思成眼中的中国雕塑史
》
售價:HK$
74.8

《
埃及大历史:“笔与剑奖”获得者伯纳德·卢甘力作,俯瞰神秘王朝的权力角逐
》
售價:HK$
64.9

《
意大利马克思主义史
》
售價:HK$
173.8

《
DK历史百科(典藏版)(全彩)
》
售價:HK$
118.8

《
万有引力书系 奥斯曼的宦官:从非洲奴隶到权力掮客
》
售價:HK$
107.8

《
祛魅:你以为的真是你以为的吗?(深度剖析看穿事物本质,祛魅让你更真实地看待世界和自己)
》
售價:HK$
63.8

《
巫术的历史
》
售價:HK$
107.8
|
編輯推薦: |
1. 颠覆认知的“万物理论”? 贝叶斯定理以简洁公式揭示复杂世界的不确定性规律,从医学检测到AI决策,从法庭证据到科学实验,重新定义我们对概率的认知。
2. 跨学科的实用指南 ?医学决策:揭秘癌症筛查误诊率真相,解读新冠检测数据背后的逻辑。 ?法律与AI:剖析“检察官谬误”,展示DNA证据的局限性;拆解ChatGPT等AI技术的底层贝叶斯逻辑。 ?日常生活:用三门问题、超能力谣言等案例,教会读者理性应对信息陷阱。
3. 历史与科学的双重叙事 ?传奇人物群像:从牧师贝叶斯到统计学家费希尔,还原定理诞生背后的思想交锋与人性故事。 ?科学革命现场:重现“可重复性危机”等现代科学困局,揭露p值滥用如何导致研究结论失真。
4. 大脑与认知的终极解码 ?神经科学突破:用贝叶斯原理解释视错觉、致幻剂体验,提出“大脑是贝叶斯预测机器”的颠覆理论。 ?精神疾病新解:探讨精神分裂症患者为何无法自我挠痒痒,展现意识形成的数学本质。
5. 写给普通人的硬核科普 ?零公式恐惧:作者以自嘲式幽默消解数学门槛,用扑克牌、赌局等生活场景化解抽象概念。 ?时代共鸣:结合新冠疫情检测争议、阴谋论传播等热
|
內容簡介: |
一个诞生于200多年前的数学定理,为什么能在漫长的时间里改变医学、法律、科研、人工智能等多个领域,并成为个人理性思考和决策的强大工具? 这正是贝叶斯定理的魅力所在。它不仅仅是一个数学公式,更是一种帮助我们在不确定性中寻找答案的思维方法。当体检报告出现异常指标时,它帮助你理性评估是否需要进一步检查;当需要对重要事实做出判断时,它教你如何权衡各种证据;在人工智能时代,它甚至是许多智能算法背后的核心原理。 本书以生动活泼的笔调,通过引人入胜的故事和案例,展示了这个源自18世纪长老会牧师托马斯·贝叶斯的研究如何产生深远影响。贝叶斯定理将帮助你学会区分相关性和因果关系,避免常见的认知偏差和决策陷阱,在纷繁复杂的信息中提取真正有价值的内容。即使没有任何数学基础,书中的真实案例分析和实践指南也能让你轻松掌握这套思维方法。 在信息爆炸的时代,拥有一个可靠的思维框架比任何时候都重要。让我们一起走进贝叶斯的世界,在这个充满不确定性的时代,找到属于自己的确定性,在复杂中保持清醒。
|
關於作者: |
作者汤姆·奇弗斯著作方式著作者简介汤姆·奇弗斯(Tom Chivers) 著名科普作者、出版人,他擅长解释复杂理论在日常生活中的实际应用,因而成为了科学写作领域广受欢迎的作家之一。2018年、2020年两次获得皇家统计学会卓越奖;2021年荣获英国科学作家协会的年度科学记者奖。
|
目錄:
|
引言 一个近乎于 “万物理论” 的理论
第一章 从《公祷书》到《蒙特卡罗六壮士》
?托马斯 贝叶斯
?帕斯卡与费曼
?大数定律
?亚伯拉罕 棣莫弗与正态分布
?辛普森与贝叶斯
?贝叶斯的 “台球” 比喻
?理查德 普莱斯,世上第一位贝叶斯主义者,试图将上帝从大卫 休谟的手中拯救回来
?从贝叶斯到高尔顿
?高尔顿、皮尔逊、费希尔与频率学派的兴起
?频率学派涉嫌种族歧视?
?贝叶斯主义的衰落
?统计显著性
?贝叶斯理论岌岌可危?
?“我双眼已见证,概率之神托马斯 贝叶斯牧师的荣耀”
第二章 科学中的贝叶斯思想
?可重复性危机及应对方案
?奶酪做的月亮、超能力、超光速粒子
?卡尔 波普尔和他的 “天鹅理论”
?贝叶斯理论与可重复性危机
?丹尼斯 林德利悖论
?如何确定你的先验概率
?你并不是在白费力气,你只是尚未成功
第三章 决策论中的贝叶斯思想
?亚里士多德与乔治 布尔
?贝叶斯理论是决策论的核心思想
?克伦威尔法则
?意料之中的证据
?效用、博弈论、荷兰赌
?奥卡姆剃刀与先验概率
?超先验
?非此即彼的假说&多个假说
?AI 中的贝叶斯思想
第四章 生活中的贝叶斯思想
?人类是理性的吗?
?人们对 “三门问题” 的误解
?超级预测者(第一部分)
?超级预测者(第二部分)
?贝叶斯认识论
第五章 贝叶斯式的大脑
?从柏拉图到格里高利
?视错觉
?真实只是一种 “受控的幻觉”?
?多巴胺与 “复杂的计算装置”
?网球、猜词游戏、“眼跳”
?为什么精神分裂症患者可以自己挠自己的痒痒?
?你有没有认认真真、仔仔细细地看过自己的手?
?上帝保佑!
总结 贝叶斯式的生命
致谢
|
內容試閱:
|
引言 一个近乎“万物理论”的理论
精神病学领域有一条通用准则:如果你认为自己找到了可 以解释万物的终极理论, 那你应该是患上了妄想症,快去医院 看看吧。
—斯科特·亚历山大
我们能预测未来吗?当然可以! 可以肯定的是,接下来的几秒钟内你必然会吸进一口气,再把 它呼出去。你还可以自信地预测,你的心脏会继续跳动,每秒一到 三下;明早太阳会照常升起,尽管具体时刻取决于你所处的纬度和 时节,但精准的数据并不难找。
你还可以预测火车到站的时间,预测你的朋友会准时抵达事先 说好的饭店,尽管你在做出这些预测时的自信程度会受到具体是哪 家铁路公司、哪位朋友的影响。
此外你还可以预测,世界人口将持续增长至 21 世纪中叶,然后开始下降;2030 年的全球平均地表温度将高于 1930 年。
未来并非无法窥测,我们有能力拨开迷雾一探究竟。有些东西 很好预测,比如根据传统力学预测几千年之内的行星轨迹;有些东 西则很难预测, 比如在混沌理论的背景下预测天气——能预测几天 就很了不起了。但不管怎么说,我们总能掀开帷幔,或多或少地看 到一些未来。
大众口中的“预测未来”通常指的是一些极为神秘的、 涉及 超自然力量的、神一般的预言。但本书提到的“预测未来”并不是 这个意思,我们很难有这种通天之术(后文会提到一位科学家,他 认为我们的确有这种能力,读完之后你就会明白,他肯定是错的)。 事实上,我们根本不需要那种夸张的能力就能做出预测。我们这一 生从来就没有停止过对未来的预测,预测和生命是密不可分的。有 些预测是很基本的,比如每次吸气时,我们都会下意识地预测“空 气一直是可吸入的”。 有些预测是较为复杂的, 比如“街角的商店 里会有欧倍牌麦片,我走进去就能买到”,每个决策都伴随着类似的 预测。我们做出这些预测并非基于超能力,而是基于我们的经验。
所有预测都存在一个问题,即结果的不确定性。我们不清楚这 个世界到底是建立在决定论之上的, 还是建立在非决定论之上的。 倘若我们可以像全知全能的上帝一样,知晓宇宙中每个粒子的位置、 动量、性质,那我们或许就能完美地预测世间万物,比如每只麻雀 的死亡 1 。可惜我们并非全知全能,我们能够掌握的信息很有限 2 。 我们没有完美的感知能力,所以我们无法看到宇宙的每个细节,但 我们可以利用有限的信息做出不完美的预测,比如我们可以大体预 测出不同事物的活动方式:像人一样的事物会倾向于寻找食物、组建团队,像岩石一样的事物往往只能静止不动。 生命不是一局国际象棋,而是一场扑克游戏,因为前者的信息 是完全的,理论上我们可以“应对”任何状况;而后者的信息是有 限的,我们只能尽量根据掌握的信息做出最佳决策。
本书的主要内容就是帮你学会做出最佳决策的“公式”。
《时间简史》出版之后,史蒂芬·霍金曾说过这样一句话:“有人 对我说,书里每多出一个公式,它的销量就会减少一半。” 2 可我这本书的核心内容就是一个公式,想要一个公式都没有也太困难了。1
这个公式就是著名的贝叶斯定理,它是一个极为简洁的等式:
说来实在惭愧,其实我也讨厌看到数学公式。虽然硬要我去使 用公式的话,我也不是做不到,但我实在感到乏味无趣。可你知道 吗,最尴尬的是,虽然我已经写了 3 本书,且每本书都和数学密切 相关, 但在看到 Σ 这个符号的时候, 我的大脑仍会频频宕机。 我 想大多数读者都和我有着类似的感受,这或许就是出版社警告霍金 尽量不要在书中列出公式的原因。
不过我们也没必要谈方程色变,方程并不是什么晦涩难懂的咒 语或密码,它只是一种简便的书写方式,每个小符号都代表一个简 单的步骤(我常常这样安慰自己)。
贝叶斯定理也是如此,它只是一个概率公式,它可以根据已知信息算出某件事发生的概率。具体来说,它是一种条件概率。公式中的 竖线“|”是“在此情况下”或“以此为前提条件”的简写, P(A |B) 则指的是“在事件 B 已经发生的情况下,事件 A 发生的概率”。
这里我们给出一个条件概率的简例。你手中有一副去掉大小王 的扑克牌,你想知道从中抽到红桃的概率。已知扑克牌一共有 52 张, 红桃有 13 张, 我们可以据此算出其概率——记作 P( )——等于 13/52, 或 1/4, 用数学语言表示就是 p=0.25。 然后我们假定你抽了 一张牌,是梅花,那么此时抽到红桃的概率是多少呢?我们知道牌 堆中仍然有 13 张红桃, 但牌的总数变成了 51, 所以此时概率变成 了 13/51,或者说 p ≈ 0.255。这就是你已经抽出一张梅花的情况下, 再抽到一张红桃的概率,即 P( | )。
再举一例:伦敦某天下雨的概率是多少?答案是 0.4 左右, 因 为伦敦每年大约有 150 天在下雨。现在你往窗外瞥了一眼,发现乌 云密布,那么此时下雨的概率是多少?我也不知道确切答案,但我 知道,阴天下雨的概率肯定更高。
贝叶斯定理其实也是这个意思,只不过它的适用场景更为广泛。 用通俗的语言来解释公式的四个部分, 就是这个样子:(事件 B 已 经发生的情况下, 事件 A 发生的概率)=(事件 A 已经发生的情况 下,事件 B 发生的概率)×(事件 A 单独发生的概率)÷(事件 B 单独发生的概率)。
现在假设我们的社会出现了一种大规模传播的疾病(可以参考 刚刚经历的新冠疫情)。
为了弄清自己到底有没有染上这种病, 你做了一个测试。测试的指导手册上写着这样一句话:“本测试的灵敏度和特异度均为 99%。”也就是说, 如果你真的染上了这种病, 那么这个测试有 99% 的概率可以准确地告诉你,你确实染上了这种病;如果你没有 染上这种病, 那么它也有 99% 的概率可以准确地告诉你, 你没有 染上这种病。另外我们还可以这样理解:该测试的“假阴性率”和 “假阳性率”都是 1%。
现在假定你的试纸上出现了两条红线,也就是说测试结果呈阳 性。 这意味着什么呢?你可能会自然而然地认为, 自己有 99% 的 概率被传染了。
但贝叶斯定理会告诉我们,事实并非如此。
贝叶斯定理是一个非常奇怪的定理。它的表达式十分简洁,写 出来不占什么篇幅,涉及的运算只有乘法和除法,就连 8 岁小孩都 会算。 它的提出者也只是一个生活在 18 世纪的普通富绅, 这位富 绅白天会在坦布里奇韦尔斯担任牧师,但他并不信奉英格兰国教1 , 研究数学也只是业余爱好。 尽管如此, 贝叶斯定理仍旧产生了极 为深远的影响——它可以解释为什么即便癌症测试呈阳性的人中有 99% 都没有癌症, 测试的准确率仍然可以高达 99%;为什么 DNA (脱氧核糖核酸)鉴定只有两千万分之一的概率匹配错人, 但它仍 有很大概率导致冤假错案;为什么一个科学结论明明具有“统计显 著性”,但它仍旧有很大概率是错的。
贝叶斯定理还涉及迷人的哲学思辨。“概率”是真实存在的 吗?我们说掷色子有六分之一的概率掷出 1,这到底是什么意思?它是宇宙中确切存在的事实, 还是我们对这个世界所持有的一种信 念?一次性事件也有概率吗?如果我告诉你, 曼城队有 90% 的概 率成为 2025 年的英超冠军,那这到底意味着什么呢?
每次我们面对不确定的事物做出决策时—— 一直以来我们都是 这样做的——都可以利用贝叶斯定理来判断该决策在多大程度上算 是个好决策。事实上,无论是怎样的决策过程,无论你为了实现某 个目标对世界产生了多大的影响,无论你掌握的信息多么有限,无 论你是正在寻找高浓度葡萄糖环境的细菌,是正在利用复制行为传 播遗传信息的基因,还是正在努力实现经济增长的政府,只要你想 把事情干好,你就离不开贝叶斯定理。
AI(人工智能)本质上也是贝叶斯定理的一个具体应用。 从 最基本的层面来说,AI 所做的事情就是“预测”。 一个可以分辨 猫狗图像的 AI 应用, 本质上就是在根据过往的训练数据和当前 的图像信息去“预测”人类对图片的判断。DALL-E 2、GPT-4、 Midjourney 等各种优秀的 AI 应用, 正在以令人应接不暇的速度一 次次冲击人们的认知,我写下这段话的时候可能就刚好有一个震撼 世界的 AI 应用横空出世。 不过, 这些和你谈笑风生、 为你生成高 质量图像的 AI,本质上也是在做预测,只不过它们预测的是人类作 家、人类艺术家面对这些提示词时会如何作答。这些预测行为的基 础都是贝叶斯定理。
大脑的工作也离不开贝叶斯定理,这就是人类容易产生视错觉、 致幻剂可以致幻的原因,同时也是思想意识的工作原理。
贝叶斯定理可以让我们明白, 为什么阴谋论的观点难以转变; 为什么两个人可以根据同样的证据得出完全相反的结论。比如,为
什么那些科学事实能够让我相信疫苗安全有效,却无法说服一个怀 疑论者呢?答案就是,根据贝叶斯定理,一个人对新信息的判断会 受到既有认知的影响。这并不是说那些怀疑疫苗的人、那些阴谋论 者是大脑运转方式与众不同的外星人,而是说他们也是完全理性的 人,只不过他们的行为建立在固有思想之上。贝叶斯定理可以很好 地解释这一点。
由此可见,虽然贝叶斯定理不是万物理论,但实际上也差不多 了。一旦你开始站在贝叶斯定理的视角去看待问题,你就会发现贝叶 斯定理真的是无处不在。我写这本书的目的就是帮你做到这一点。
通常人们会用医疗检测来解释贝叶斯定理,本书也不例外。这 里我们给出一些比较可靠的数据:假定你正准备进行乳腺癌的筛查 检测,且已经知道,如果某位女性的确患有癌症,那么乳房 X 光在 80% 的情况下可以正确识别出癌症(灵敏度为 80%), 在另外 20% 的情况下会发生漏诊,即假阴性;如果某位女性没有癌症,那么乳 房 X 光在 90% 的情况下可以正确排除癌症(特异度为 90%),在另 外 10% 的情况下会发生误诊,即假阳性。
假定你的检测结果呈阳性, 那是不是说明, 你有 90% 的概率 患上了乳腺癌?不是的。事实是,根据上面给定的这些信息,你根 本无法判断自己患上乳腺癌的概率到底有多大。
你还需要额外掌握一个信息,那就是在参加检测之前,你对自己 患上乳腺癌的概率的预估。最简单的预估方式就是找出特定时期内, 与你同龄的女性中的乳腺癌患者的比例。我们假定这一比例为 1%。
为了让案例更加具体,我们进一步假定共有 10 万名女性参加了 检测,那么按照 1% 的患病比例来看,这些人中一共有 1000 名乳腺
癌患者。 在这 1000 名患者当中, 乳房 X 光只能正确检测出 800 名, 另外 200 名将会出现漏诊;剩下的 99000 人没有患乳腺癌, 在这些 健康人当中, 乳房 X 光只能正确判断出 89100 人, 这意味着会有 99000-89100=9900 人被误诊为乳腺癌。下面我们把数据整理成表格:
有乳腺癌 (共 1000 人)
80% (真阳性) 800 人
20% (假阴性) 200 人
没有乳腺癌 (共 99000 人)
检测结果呈阳性
检测结果呈阴性
10% (假阳性) 9900 人
90% (真阴性) 89100 人
现在你明白了吧,得到阳性结果的女性一共有 10700 名,其中 只有 800 人真的患有乳腺癌。换句话说,假定你的测试结果呈阳性, 那么你真正患有乳腺癌的概率是 800/10700 ≈ 0.07,即 7%。
具体结果完全取决于检测前人群中患有乳腺癌者的比例。假如 检测对象是高风险人群,比如具有家族癌症史的老年妇女,那么这 一比例可能高达 10%,此时计算结果会发生翻天覆地的变化。
有乳腺癌 (共 10000 人)
80% (真阳性) 8000 人
20% (假阴性) 2000 人
没有乳腺癌 (共 90000 人)
检测结果呈阳性
检测结果呈阴性
10% (假阳性) 9000 人
90% (真阴性) 81000 人
现在真阳性的人数从 800 涨到了 8000, 假阳性的人数下降 至 9000。 此时一个拿到阳性结果的人真正患乳腺癌的概率变成了 8000/17000,结果约为 47%。知道这一点后,拿到阳性结果的人会 比刚才更加忧虑。整个检测方法没有任何变化,发生变化的只有先 验概率。
换句话说,贝叶斯定理可以告诉你结果的可靠程度。可是要做 到这一点的话,你必须对这件事有一个先验预估。
现在我们再来看看这个公式(本书的销量该不会又减半了 吧……毕竟这个公式刚才已经出现过一次)。
经过一系列计算之后, 我们得到的结果就是 P(A|B) , 即事件 B 已经发生的情况下, 事件 A 发生的概率。 癌症检测与之类似, 我 们想知道的是, 在检测结果呈阳性的情况下, 该患者真正患癌的 概率。
可是“灵敏度 80%”并没有给出 P(A|B) , 反而给出了与之相 反的 P(B|A), 即事件 A 已经发生的情况下,事件 B 发生的概率。也 就是说,它可以告诉我们,一个真正患有乳腺癌的人,有多大概率 取得阳性结果。
乍一看好像没什么不同,实际上这两者的区别就像“某个人刚 好是教皇的概率仅有八十亿分之一”和“教皇刚好是个人类的概率 仅有八十亿分之一”的区别一样大。3
为了得到想要的数据,我们需要更多信息。在癌症检测的例子中,我们需要的额外信息是乳腺癌患者在人群中的比例。在医学中, 我们将其称为发病率,或背景发生率;在贝叶斯定理中,这种额外 信息一般被称为先验概率。
医学中的先验概率比较容易获得, 也很容易定义。 比如你想 知道某人患上亨廷顿病的风险,那你可以去查询全科诊所的诊疗记 录 4 ,然后据此算出平均每 10 万人当中约有 12.3 人患有该疾病。
其他情况则要复杂得多。如果几年前你想计算俄乌爆发冲突的 概率,那这个先验概率该怎么算?先算一下俄乌每年爆发冲突的频 次?还是先统计一下所有冲突爆发的频次?或是先调查一下,看看 两国边境突然增派大量坦克的时候,双方爆发冲突的概率?
再举一例。 假定我提出了一个科学假说, 做了一次相关实 验,且取得了不错的数据,此时该假说是一个正确假说的概率有多 高?我们进一步假定, 如果该假说是错误的, 那每 20 次实验中只 有 1 次能取得这种数据。这是不是意味着,我的假说大概率是正确 的?不是这样的, 因为它还和另一个概率有关——我开始做实验之 前,该假说为真的概率,即先验概率。可我该上哪儿去搞到这个数 据呢?
法庭辩护中也有一个经典案例。 在已经取得某些法庭证据的 情况下, 该嫌疑人有罪的概率是多少?假定嫌疑人的 DNA 恰好出 现在现场的概率只有百万分之一,那是不是说明警察只有百万分之 一的概率抓错了嫌疑人?不是这样的,因为这还取决于一开始警察 就抓到了正确嫌疑人的概率有多大。可问题是,这项数据上哪儿去 找呢?
放心,这些问题本书都会一一作答(有很多数学家研究过相关
10
贝叶斯定理 问题)。 需要牢记的是, 必须先得到一个先验概率, 我们才能进一 步应用贝叶斯定理。缺失了先验概率,我们只能得到一些不靠谱的 结论。 大多数人第一次听说贝叶斯定理都是在医学领域,所以我们的 旅程也从医学领域开始。
这么多年来, 我逐渐爱上了贝叶斯定理。 第一次听说贝叶斯 定理, 是在本·戈尔达克瑞于 21 世纪初在《卫报》上开设的《小 心坏科学!》专栏当中。自那时起,我就对贝叶斯定理越来越着迷。 包括本书在内,我已经出版了 3 部作品,其中每本书都或多或少地 提到了贝叶斯定理。该定理常常能够得出一些反直觉的结论,令人 连连称奇。比如,某项测试的准确率为 99%,并不意味着该测试在 99% 的情况下是正确的。这到底是什么鬼话?虽然只要按部就班地 推导,就能逐渐理解这一事实,但类似的结论总是能够让人感到不 可思议,刷新认知(至少我的感受是这样的)。
|
|