新書推薦:
《
同与不同:50个中国孤独症孩子的故事
》
售價:HK$
66.1
《
开宝九年
》
售價:HK$
54.9
《
摄影构图法则:让画面从无序到有序
》
售價:HK$
110.9
《
论僭政:色诺芬《希耶罗》义疏(含施特劳斯与科耶夫通信集)
》
售價:HK$
109.8
《
一个经济杀手的自白
》
售價:HK$
109.8
《
传播与流动:移民、手机与集装箱(新闻与传播学译丛·学术前沿系列)
》
售價:HK$
109.8
《
大唐诡异录
》
售價:HK$
55.8
《
《证券分析》前传:格雷厄姆投资思想与证券分析方法
》
售價:HK$
134.3
|
編輯推薦: |
本书作为塔勒布“不确定性量化研究”系列的第一卷,通过大量的数学语言,以更清晰的方式梳理了肥尾分布的框架。对于有一定数学基础的读者,这种无需透过哲学隐喻,直达本质的表述令人酣畅淋漓。同时在本书的后半部分,作者通过对股票指数、战争、大选、期权等多个主题的定量研究,直接展示了现实世界中肥尾分布的底层属性,提出了具体的策略,以应对不可预知的未来。
|
內容簡介: |
我们所在的世界是如此不确定和不透明,信息和我们的理解都极不完整,却很少有人研究在这种不确定性的基础上我们应该做什么。塔勒布的不确定性系列,包括《随机漫步的傻瓜》《黑天鹅》《反脆弱》《非对称风险》以及本书开启的不确定性量化研究系列,都是主要关注我们该如何在一个不确定性结构过于复杂的现实世界中生活。
本书从数学和统计学出发,讲述产生极端事件的统计分布类型,以及在这些分布下如何进行统计推断并做出决策。作者认为,社会科学和金融学研究中现有的大多数“标准”统计理论均来自薄尾分布,然而用薄尾思维衡量肥尾事件有可能导致严重问题。例如,某些“专家”认为,从死亡数字看,我们更应该担心死于吸烟或糖尿病,而非埃博拉病毒。在新冠肺炎疫情暴发初期,很多不懂统计学的流行病学家都犯过类似的错误,而事实证明,我们对具有倍增效应的高风险疾病担心得太少。
在金融市场,一个人所获得的不是概率,而是直接的财富。分布的尾部越肥,就越需要关心收益空间。“收益远胜于概率。”如果犯错的成本够低,决策者可以经常犯错,只要收益是凸性的(即预测准确时会获得很大的收益)。反过来,决策者也可以在预测准确率高达99.99%的情况下破产。事实上,2008年金融危机期间,破产的基金恰恰是那些之前业绩无可挑剔的基金。
总之,不理解肥尾效应会导致谬误。糟糕的是,这种谬误在当今世界,尤其是金融领域非常普遍。面对风云诡谲的金融市场与不确定性结构异常复杂的现实世界,作者在本书中为参与者点出了破局之道:小概率极端事件不可预测,理解肥尾效应、管理尾部风险是必然选择。
|
關於作者: |
纳西姆·尼古拉斯·塔勒布
畅销书《随机漫步的傻瓜》《黑天鹅》《反脆弱》《非对称风险》作者。
塔勒布是我们这个时代伟大的思想者之一,是当今令人敬畏的风险管理理论学者,被誉为拥有“罕见的勇气与博学”。他倾其一生研究概率和风险问题,撰写了50篇学术论文来探讨“不确定性”,内容涉及国际关系、风险管理、统计物理学。他大部分时间都在闲逛,在世界各地的咖啡馆中冥想。在成为作家和学者之前,塔勒布做过20年交易员,目前是纽约大学理工学院风险工程学特聘教授。
塔勒布的“不确定性”系列作品已被译为41国语言在全球发行。
|
目錄:
|
序言
术语、符号和定义
一般符号和常用符号
一般&特殊概念目录
幂率类分布P
大数定律(弱)
中心极限定理(CLT)
中数定律和渐进论
Kappa统计量
椭圆分布
统计独立性
多变量(列维)稳定分布
多变量稳定分布
卡拉玛塔点
亚指数
近似替代:学生T分布
引用环
学术寻租
伪经验主义或Pinker问题
前渐进性
随机化
在险价值VAR,条件在险价值CVAR
利益攸关
MS图
最大吸引域MDA
心理学文献中的积分替换
概率的不可分拆性(另一个常见误区)
维特根斯坦的尺子
黑天鹅
经验分布会超出经验
隐藏的尾部
影子矩
尾部依赖
元概率
动态对冲
I 肥尾及其效应介绍
非数理视角概述 - 剑桥大学达尔文学院讲义
3.1 薄尾和厚尾的差异
3.2 直观理解:摇尾巴的狗
3.3 一种(更合理的)厚尾分类方式及其效应
3.4 肥尾分布的主要效应及它们与本书的关联
3.4.1 预测
3.4.2 大数定律
3.5 认识论与不对称推理
3.6 幼稚的经验主义:不应该把埃博拉和从楼梯上摔落进行对比
3.6.1 风险是如何倍增的
3.7 幂律入门(几乎没有数学)
3.8 隐藏性质在哪里?
3.9 贝叶斯图谱
3.10 x和f(x):混淆我们理解的x和相应风险暴露
3.11 破产和路径依赖
3.12 如何应对
单变量肥尾,有限矩(第一层)
4.1 构造轻微肥尾的简单方法
4.1.1 固定方差的增厚尾部方法
4.1.2 通过有偏方差增厚尾部
4.2 随机波动率是否能产生幂律?
4.3 分布的躯干,肩部和尾部
4.3.1 交叉和隧穿效应
4.4 肥尾,平均差和上升范数
4.4.1 常见误区
4.4.2指标分析
4.4.3 肥尾效应对STD vs MD“有效性”的影响
4.4.4 矩和幂均不等式
4.4.5 评述:为什么我们应该立刻弃用标准差?
4.5 可视化p上升产生的等范数边界效应
亚指数和幂率(第二层)
5.0.1 重新排序
5.0.2 什么是边界概率分布?
5.0.3 创造一个分布
5.1 尺度和幂率(第三层)
5.1.1有尺度和无尺度,对肥尾更深层的理解
5.1.2 灰天鹅
5.2 幂率的性质
5.2.1 变量求和
5.2.2 变换
5.3 钟形 vs 非钟形幂率
5.4 示例:幂率分布尾部指数插值
5.5 超级肥尾:对数帕累托分布
5.6 案例研究:伪随机波动率
高维空间厚尾
6.1 高维空间中的厚尾,有限矩
6.2 联合肥尾分布及其椭圆特性
6.3 多元学生T分布
6.3.1 肥尾条件下的椭圆性和独立性
6.4 肥尾和互信息
6.5肥尾和随机矩阵,一个小插曲
6.6 相关性和未定义方差
6.7 线性回归模型的肥尾误差项
A 特殊厚尾案例
A.1多重模型与厚尾,战争-和平模型
A.2 转移概率:有破碎可能的事物终将破碎
II中数定律
极限分布综述
7.1 温习:弱大数定律和强大数定律
7.2 中心极限过程
7.2.1 稳定分布
7.2.2 稳定分布的大数定律
7.3 CLT的收敛速度:直观探索
7.3.1 迅速收敛:均匀分布
7.3.2 中速收敛:指数分布
7.3.3 慢速收敛:帕累托分布
7.3.4 半立方帕累托分布及其收敛分布族
7.4 累积量和收敛性
7.5 数理基础:传统版本的中心极限定理
7.6 高阶矩的大数定律
7.6.1 高阶矩
7.7 稳定分布的平均差
第八章 需要多少数据?肥尾的定量衡量方法
8.1 定义与介绍
8.2 统计量
8.3 收敛性基准,稳定分布类
8.3.1 稳定分布的等价表述
8.3.2 样本充足率的实际置信度
8.4数量化效应
8.4.1 非对称分布的一些奇异特性
8.4.2 学生T分布向高斯分布的收敛速率
8.4.3 对数正态分布既非薄尾,又非肥尾
8.4.4 κ可以为负吗?
8.5 效应总结
8.5.1投资组合的伪稳定性
8.5.2 其他领域的统计推断
8.5.3 最终评述
8.6 附录,推导和证明
8.6.1 立方学生T分布(高斯族)
8.6.2 对数正态分布
8.6.3 指数分布
8.6.4 负Kappa和负峰度
第九章 极值和隐藏尾部
9.1 极值理论简介
9.1.1 各类幂率尾如何趋向Fréchet分布
9.1.2 高斯分布的情形
9.1.3 皮克兰·巴尔克马·德哈恩定理
9.2 幂率分布看不见的尾
9.2.1 和正态分布对比
9.3 附录:经验分布的经验有限
B 增速和结果并非同类分布
B.1 谜题
B.2 瘟疫的分布极度肥尾
C 大偏差理论简介
D 帕累托性质拟合
D.1 样本尾部指数的分布
第十章 “事实就是这样” SP500分析
10.1 帕累托性和矩
10.2 收敛性测试
10.2.1 测试1:累积样本峰度
10.2.2 最大回撤
10.2.3 经验Kappa
10.2.4 测试2:超越某值的条件期望
10.2.5 测试3 - 四阶矩的不稳定性
10.2.6 测试4:MS图
10.2.7 历史记录和极值
10.2.8 左右尾不对称
10.3 总结:事实就是这样
E 计量经济学的问题
E.1 标准带参风险统计量的表现
E.2 标准非参风险统计量的表现
F 有关机器学习
F.0.1 拟合有角函数
III 预报、预测和不确定性
第十一章 肥尾条件下的概率校准
11.1 连续 vs 离散分布:定义和评述
11.1.1 与描述的差异
11.1.2 肥尾条件下不存在“崩溃”,“灾难”或“成功”
11.2 心理学中对尾部概率的伪高估
11.2.1 薄尾情况
11.2.2 肥尾情况
11.2.3 误区
11.2.4 分布不确定性
11.3 校准和校准失误
11.4 表现统计量
11.4.1分布推导
11.5 赔付函数/机器学习
11.6 结论
11.7 附录:证明和推导
11.7.1 二元计数分布p^((p) ) (n)
11.7.2 布里尔分数的分布
第十二章 鞅过程大选预测:套利法
12.0.1 主要结论
12.0.2 框架
12.0.3 有关风险中性的讨论
12.1 巴舍利耶风格的估值
12.2 有界双重鞅过程
12.3 与德费内蒂概率评估的关系
12.4 总结和评述
IV 肥尾条件下的不均估计
第十三章 无限方差下的基尼系数估计
13.1 介绍
13.2 无限方差下非参估计的渐进性质
13.2.1 α-稳定随机变量回顾
13.2.2 基尼系数的α-稳定渐进极限
13.3 极大似然估计
13.4 帕累托数据
13.5 小样本修正
13.6总结
第十四章 分位数贡献的估计误差和超可加性
14.1 介绍
14.2帕累托尾分布
14.2.1 偏差和收敛性
14.3 累加不等性质的不等性
14.4 尾部指数的混合分布
14.5 变量和越大,κ ?_q越大
14.6 结论以及如何合理估计集中度
14.6.1 稳健方法和完整数据的使用
14.6.2 我们应该如何测量集中度?
V 影子矩相关论文
第十五章 无限均值分布的影子矩
15.1 介绍
15.2 双重分布
15.3 回到y:影子均值(或总体均值)
15.4 和其他方法的比较
15.5 应用
第十六章 暴力事件的尾部风险
16.1 介绍
16.2 统计讨论汇总
16.2.1 结果
16.2.2 总结
16.3 研究方法讨论
16.3.1 重整化方法
16.3.2 条件期望(严谨性稍弱)
16.3.3 数据可靠性和对尾部估计的影响
16.3.4 “事件”的定义
16.3.5 事件遗漏
16.3.6 生存偏差
16.4 数据分析
16.4.1 阈值之上的峰值
16.4.2 事件间隔和自相关性
16.4.3 尾部分析
16.4.4 有关极大值的另类视角
16.4.5 全数据集分析
16.5 额外的鲁棒性和可靠性测试
16.5.1 GPD自展法
16.5.2 估计边界的扰动
16.6 结论:真实的世界是否比看起来更不安全?
16.7 致谢
第G章 第三次世界大战发生的概率有多高?
VI 元概率相关论文
第十七章 递归的认知不确定性如何导致肥尾
17.1 方法和推导
17.1.1不确定性的层级累加
17.1.2 标准高斯分布的高阶积分
17.1.3 小概率效应
17.2 状态2:a(n)为衰减参数
17.2.1 状态2-a “失血”高阶误差
17.2.2 状态2-b 第二种方法,无倍增误差率
17.3 极限分布
第十八章 不对称幂律的随机尾部指数
18.1 背景
18.2 Alpha随机的单尾分布
18.2.1 一般情况
18.2.2 随机Alpha不等式
18.2.3 P分布类近似
18.3 幂律分布求和
18.4 不对称稳定分布
18.5 α为对数正态分布的帕累托分布
18.6 α为Gamma分布的帕累托分布
18.7 有界幂律,西里洛和塔勒布(2016)
18.8 其他评论
18.9致谢
第十九章 p值的元分布和p值操控
19.1 证明和推导
19.2检验的逆功效
19.3 应用和结论
第H章 行为经济学的谬误
H.1 案例研究:短视损失厌恶的概念谬误
VII期权交易和肥尾条件下的定价
第二十章 金融理论在期权定价上的缺陷
20.1 巴舍利尔而非布莱克-斯科尔斯
20.1.1 现实和理想的距离
20.1.2 实际动态复制过程
20.1.3 失效:对冲误差问题
第二十一章 期权定价的唯一测度(无动态对冲和完备市场)
21.1 背景
21.2 证明
21.2.1 案例1:使用远期作为风险中性测度
21.2.2 推导
21.3 当远期不满足风险中性
21.4 评述
第二十二章 期权交易员从来不用BSM公式
22.1 打破链条
22.2 介绍
22.2.1 布莱克-斯科尔斯只是理论
22.3 误区1:交易员在BSM之前无法对期权定价
22.4 方法和推导
22.4.1期权公式和Delta对冲
22.5 误区2:今天的交易员使用布莱克-斯科尔斯定价
22.5.1我们什么时候定价?
22.6动态对冲的数学不可能性
22.6.1 高斯分布的迷之稳健性
22.6.2订单流和期权
22.6.3巴舍利尔-索普方程
第二十三章 幂律条件下的期权定价:稳健的启发式方法
23.1 介绍
23.2 卡拉玛塔点之上的看涨期权定价
23.2.1 第一种方法,S属于正规变化类
23.2.2 第二种方法,S的几何收益率属于正规变化类
23.3 看跌期权定价
23.4 套利边界
23.5 评述
第二十四章 量化金融领域的四个错误
24.1 混淆二阶矩和四阶矩
24.2分析期权收益时忽略简森不等式
24.3保险和被保资产之间的不可分割性
24.4 金融领域计价单位的必要性
24.5附录(押注分布尾部)
第二十五章 尾部风险约束和最大熵
25.1投资组合的核心约束是左尾风险
25.1.1 杰恩斯眼中的杠铃策略
25.2 重新审视均值-方差组合
25.2.1 分析约束条件
25.3 再论高斯分布
25.3.1 两个正态分布混合
25.4 最大熵
25.4.1 案例A:全局均值约束
25.4.2 案例B:均值绝对值约束
25.4.3 案例C:右尾服从幂律
25.4.4 扩展到多阶段模型
25.5 总结评述
25.6 附录/证明
参考书目
|
內容試閱:
|
不确定性(Incerto)项目背后的主要思想在于,虽然我们所在的世界是如此不确定和不透明,信息和我们的理解也极不完整,但是没有人研究在这种不确定性的基础上我们应该做什么。
本书主要讲述产生极端事件的统计分布类型,以及在这类分布下如何进行统计推断和做出决策。现有的大多数“标准”统计理论均来自薄尾分布,它们在应用于肥尾的过程中需要经过渐进性调整,这往往不是小改动,原理论可能会被完全舍弃。
根据作者的经验,一些学界教授或业界人士会说,“我们当然知道这一点”,或是更粗暴地给出结论,“肥尾没有什么新东西”,同时在分析中使用“方差”、“GARCH”(自回归条件异方差均值模型)、“峰度”、“夏普比率”或“在险价值”这样的指标,或者开展一些所谓“统计意义显著”实则完全不显著的研究。
此外,本书来自作者的不确定性量化研究系列,主要关注我们该如何在一个不确定性结构过于复杂的现实世界中生活。不确定性研究尝试在五个不同领域统一尾部概率和极端事件,包括数学、哲学、社会科学、契约论、决策论和现实世界。至于为什么是契约论,答案是:期权理论是基于或有契约或概率契约的概念,旨在调整和转移分布尾部的风险敞口;从某种意义上说,期权理论也属于数学契约论。决策论不是为了了解世界,而是为了摆脱困境并求得生存。这也是不确定性量化研究系列下一卷的主题,目前暂定书名为《凸性、风险和脆弱性》。
引用环
学术界的一种高度循环的引用机制,这种机制认为,杰出论文的标准在于他人的引用,从而忽略来自外部的过滤条件。这样会导致学术研究方向过于集中,很容易卡在某个“角落”,聚焦于没有实际意义的领域。
该机制与缺乏成熟监督,且缺乏“风险共担”的学术体系运行模式有关。典型的此类领域有现代金融理论、计量经济学(特别是宏观变量计量学)、GARCH 过程、心理计量学、随机控制金融学、行为经济和金融学、不确定性决策学、宏观经济学等。这里的很多学术成果根本无法应用于现实,唯一的作用是贡献额外的论文,并通过引用机制产生更多论文,如此循环下去。
学术寻租
科研人员在研究方向的选择上存在利益冲突,学术部门(和研究者个人)的目标变成了尽可能获得引用和荣誉,从而牺牲了研究方向的客观性。比如,很多人卡在某个科研“角落”中,仅仅因为这对他们的职业生涯和学术组织更有利。
伪经验主义或Pinker 问题
很多人都在讨论统计学意义并不显著的“证据”,或者使用对随机变量完全不适用且毫无信息量的统计指标,比如推断肥尾变量的均值或者相关性。这一点源于:
1.统计学教学上对高斯分布和其他薄尾变量的强调。
2.死记硬背统计术语的时候缺乏对统计知识的理解。
3.对于维度性质毫无概念。
上述几条在社会科学研究者中很常见。
伪经验主义的例子有:比较恐怖袭击或埃博拉病毒等流行病的致死率(肥尾)和从梯子上跌落的死亡率(薄尾)。这种看似实证的“实证主义”是现代科学研究中的一种顽疾,在多维和肥尾条件下完全失效。
实际上,我们并不需要区分肥尾和高斯随机变量就可以看出这种行为的不严谨性:没有达到简单的统计显著性标准——这些操作者也不理解显著性这个概念。
前渐进性
数学上的统计研究一般聚焦于当n =1 ( n 为求和的数目)和n = ∞ 的情况。而真实世界正是处于中间的那部分——这也是本书的核心。部分分布(方差有限)对于n = ∞ 的渐进极限是高斯分布,但是对于n 很大又不为无穷的情况并不成立。
风险共担
风险共担是一种过滤机制,强迫做菜的厨师品尝自己做的食物,让他们暴露在自身问题的风险之中,这样一来就可以将危险分子驱逐出去。能够“风险共担”的领域包括:管道维修、牙齿诊疗、外科诊疗、工程建造,这些领域的从业者以有形的工作成果被外界评估,在职业生涯断送或破产的风险下从事职业活动。无法“风险共担”的领域包括:互相引用的学术界。学术领域的从业者只依赖同侪的相互评估而非从真实世界中获得反馈。
黑天鹅
黑天鹅来自认知的不完备性,其影响在肥尾区域尤为显著。总的来说,有些事件在你的预期和建模能力之外,而且其效应极为显著。好的方法不是去预测它们,而是对它们产生的影响呈现出凸性(至少不是凹性):我们能了解自身对某类事件的脆弱性,甚至可以对其量化衡量(考量二阶影响和结果的非对称性),但是想对它们做可信的统计处理基本上是痴心妄想。
这一点向来很难跟建模人员解释清楚,我们需要和从未见过(甚至从未想过)的事物共处,但事实就是这样。1注意认知的维度。黑天鹅和观察者相关:火鸡的黑天鹅对屠夫来说是白天鹅。9·11 恐怖袭击事件对受害者来说是黑天鹅,但对恐怖分子不是。这种观察者依赖是一种中心化的性质。一个所谓的“客观”的黑天鹅概率模型不仅不存在,而且是对其自身意义的消解,因为它自身就在散播信息的不完备性。
灰天鹅:统计性质上稳定、低频且有重大影响的大偏差被称为“灰天鹅”。当然,“灰”的程度取决于观察者:幂律分布使用者的灰天鹅对困在薄尾框架体系下的天真的统计学家来说就是黑天鹅。
重申一下:黑天鹅不是肥尾,只是肥尾会让它们变得更糟糕。肥尾和黑天鹅的联系在于,肥尾区域的大偏差会放大黑天鹅的影响。
预测
在《随机漫步的傻瓜》一书中,某人被问,到月底市场更有可能上涨还是下跌?他表示上涨的可能性更大,但后来发现,他在押注市场下跌。对不懂概率的人来说,这似乎很矛盾,但是对交易员来说再正常不过了,尤其是在非标准分布的条件下(确实,市场更有可能上涨,但如果下跌会跌得更多)。这个例子表明,人们常常混淆预测和风险敞口(预测的结果是二元的,而风险敞口的结果更多元,取决于整个分布的状态)。在这个例子中,一个非常基本的错误是,将发生概率理解为单个数字而非分布结果,而在进一步研究之后,我们会发现很多并不明显或不为人知的类似的悖论式问题。简单来说,作者认为,将“概率”作为最终标的,甚至作为决策的“基础”来讨论并不严谨。
在现实世界中,一个人所获得的不是概率,而是直接的财富(或生存权利等)。这时,分布的尾部越肥,就越需要关心收益空间——俗话说得好:“收益远胜于概率。”如果犯错的成本够低,决策者可以经常犯错,只要收益是凸性的(也即当他正确的时候会获得很大的收益)。反过来说,决策者可以在预测的准确率达到99.99% 的情况下破产(实际上,破产的可能性说不定更大:2008—2009 年金融危机期间,破产的基金恰恰是那些之前业绩无可挑剔的基金1)。正如《动态对冲》[225] 一书所讨论的那样(对非量化金融领域的读者来说,可能专业性略强),这是相同行权价的香草期权和二元期权之间的区别。违背直觉的是,肥尾效应降低了二元期权的价值,同时提高了香草期权的价值。正如作者的格言所说:“我从未见过有钱的预言家。”加肥尾部会导致高于1个标准差的事件的概率下降,但对应的后果会加重(就对矩的贡献而言,比如对平均值或其他指标的影响),我们会在章节4.3.1 中具体展开。图3.12 展示了这个问题的严重程度。
概率预测误差(“校准”)与真实世界中的损益变化(或真实收益)属于完全不同的概率类别。
“校准”是一种衡量预测准确程度的方法,聚焦于概率空间——介于0 和1 之间。无论所预测的随机变量是否为厚尾分布,校准对应的所有标准测度都是薄尾的(而且因为有界,必然是超薄尾的)。另外,现实世界中的收益可能是厚尾的,因此这种“校准”的分布将遵循随机变量本身的特性。
极端斯坦下收益远胜于概率
为了考量平均斯坦和极端斯坦之间的差异,我们以飞机失事为例。假设100~400 人在事件中丧生(令人痛心),也即一个独立的负面事件,对预测和风险管理来说,我们会尽可能最小化此类风险,使其可以忽略不计。
接下来,我们考虑一种特殊的飞机失事事件,该事件会杀死所有乘坐飞机的人,包括所有过去乘坐过飞机的人。那么这还是同一类型的事件吗?后者属于极端斯坦,而对于这样的事件,我们不考虑概率,而是关注其影响。
· 对于第一种类型的事件,管理者主要考虑降低其发生概率——事件的发生频率。这里我们会数发生的次数,并尝试减少。
· 对于第二种类型的事件,主要在于降低事件发生时造成的影响。这时我们不计算概率,而是衡量其影响。
如果觉得上述实验有些奇怪,你可以考虑一下1982 年美国央行在危机中失去了之前历史上赚到的所有钱,存贷行业(现在已经不复存在)也出现过同样的事情,银行系统在2008—2009 年赔掉了之前所有的利润。我们会经常看到,某人在单次市场事件中赔掉之前的所有积蓄。而同样的事情会在很多行业发生,如汽车业和航空业。上面的银行仅仅和钱有关,对于战争,我们就无法只关注频率而不考虑其量级了,正如科普作家斯蒂芬·平克所说[194],第十六章会讨论这一点。这里还不考虑本节末尾提到的破产问题(和非遍历性)。更严格地说,如果想让原始的概率值有意义,我们就要让一系列事件满足非亚指数的克拉默条件。上述类比是本书作者和极富洞察力的拉斯·罗伯特在一次经济学讨论的播客中提出的。
在统计现象中,最知名的是帕累托分布(即80/20 法则),如20% 的意大利人拥有80% 的土地。表3.1 显示,在高斯分布下需要取30 个观测值才能使均值达到稳定的区间,而在帕累托分布下需要1011 个观测值才能使误差达到同样的水平(假设均值存在)。
尽管上述计算并不复杂,却很少有人从这个角度去思考。在估计厚尾分布均值的时候,我们并不能表明其稳定性。还有其他的办法可以做到这一点,但肯定不是通过对样本的观察。
幼稚的经验主义:不应该把埃博拉病毒和从梯子上跌落进行对比
让我们通过一个真实世界的例子来阐述用薄尾思维衡量肥尾事件带来的问题。有时候,人们会引用所谓的“经验”数据来说明我们不该担心埃博拉病毒,因为2016 年只有两个美国人死于埃博拉病毒。他们认为,从死亡数字看,我们更应该担心死于糖尿病或躺在床上。但如果我们从尾部的角度思考,假设有一天报纸报道突然死了20 亿人,他们更可能死于埃博拉病毒还是死于吸烟、糖尿病或躺在床上呢?
另外一个逻辑漏洞是,恐怖主义发生的概率之所以很低,是因为人们对它的关注度很高。一旦放松警惕,它就可能会失控。凶杀案也是同样的逻辑:恐惧带来安全。
比较这些过程属于幼稚的经验主义,这表明我们太担心埃博拉病毒(流行病或大流行病)而对糖尿病考虑不足,而事实恰恰相反,我们对糖尿病担心得太多,而对埃博拉病毒和其他具有倍增效应的疾病担心得太少。
这正是不理解厚尾效应导致的谬误——遗憾的是,这种谬误越发普遍。更糟糕的是,这种错误的推理方式还是被实证心理学促进的,而实证心理学似乎一点儿都不实证。行业里有些托儿还冒充“风险专家”,边出售杀虫剂边告诉我们不要担心,因为基于历史数据其危害不大。
风险是如何倍增的
所谓“基于证据”的方法还是太过粗略,无法处理二阶效应(风险管理领域),因此在2019 年新冠肺炎疫情中给我们带来了太多伤害。其中一个问题是,个体风险和集体风险的转换(另一个问题是对证据不足和证据理解错误的混淆)。
在新冠肺炎疫情暴发初期,很多不懂统计的流行病学家将新冠肺炎死亡风险和在游泳池中溺死的风险进行对比。这个对比可能对某个个体来说是成立的(虽然新冠肺炎迅速成为主要死因,后来甚至占纽约市死亡原因的80%),但如果加入同时导致1 000 人死亡的条件,溺死在游泳池中的概率就微乎其微了。
这是因为,你的邻居感染了新冠肺炎会提高你感染新冠肺炎的概率,但是你的邻居溺死在游泳池里不会增加你溺死的概率(在一些条件下,其他人死亡的概率还会降低,如空难事件)。这一累积问题将在后面的椭圆性中更定量地加以讨论,见第六章有关联合分布不再具备椭圆性,导致薄尾独立变量的和成为肥尾的论述。
这也是一个道德问题[247] :通过感染这种疾病你导致了大于自身的死亡。虽然得传染性疾病死亡的概率小于车祸致死的概率,但此时遵循“合理性”(也就是一阶合理性模型)显得异常荒唐,因为最终你会危害整个系统,甚至反过来伤到你自己。
|
|