新書推薦:
《
农为邦本——农业历史与传统中国
》
售價:HK$
74.8
《
郊庙之外:隋唐国家祭祀与宗教 增订版 (三联·哈佛燕京学术丛书)
》
售價:HK$
105.6
《
小麦文明:“黄金石油”争夺战
》
售價:HK$
97.9
《
悬壶杂记全集:老中医多年临证经验总结(套装3册) 中医医案诊疗思路和处方药应用
》
售價:HK$
135.1
《
无法忍受谎言的人:一个调查记者的三十年
》
售價:HK$
63.8
《
战争社会学专论
》
售價:HK$
118.8
《
剑桥意大利戏剧史(剑桥世界戏剧史译丛)
》
售價:HK$
162.8
《
教育何用:重估教育的价值
》
售價:HK$
65.8
編輯推薦:
本书贯彻统计思想重于统计计算的基本教学理念,以实证数据处理为中心阐述基本统计内容,重视统计数据和统计结果的可视化呈现,强调统计结果的合理表达。
內容簡介:
本书借鉴西方主流统计教材的模式, 图例丰富, 讲解清晰, 使用实际数据进行统计分析, 尤其 注重对统计思维和软件技能的培养, 是基于开源软件的新一代概率统计教材. 本书可供研究型大 学的经济学、社会学、心理学、政治学、管理学、教育学、医学、药学、生物学等专业作为本科 阶段的统计入门教材及软件操作教程, 也可供相关专业高年级本科生或研究生作为普通统计学教 材之外的辅导教材, 同时还可作为一本数据分析与R语言操作的入门教程.
目錄 :
第1 章概率基础. . . . . . . . .1
1.1 基础知识回顾. . . . 1
1.1.1 基本术语与符号表达. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 基本计数原理与技巧. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 概率的计算方式与公理化定义. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4
1.2.1 古典概率. . . . 4
1.2.2 经验概率. . . . 7
1.2.3 主观概率. . . . 8
1.2.4 几何概率. . . . 8
1.2.5 概率的公理化定义. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3 条件概率、独立性与贝叶斯公式. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.1 条件概率. . . 13
1.3.2 事件的独立性. . . 15
1.3.3 全概公式与贝叶斯公式. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .18
1.4 本章习题. . . . . . . . 21
第2 章随机变量. . . . . . . 23
2.1 随机变量及其分布函数. . . . . . . . . . . . .. . . . . . . . . .23
2.1.1 随机变量的定义与类型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .23
2.1.2 随机变量的分布函数. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.1.3 离散型随机变量的概率分布列. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.1.4 连续型随机变量的概率密度函数. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2 随机变量的期望与方差. . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30
2.2.1 期望的定义. 30
2.2.2 方差的定义. 32
2.2.3 期望的性质. 33
2.2.4 方差的性质. 35
2.3 常用离散型随机变量. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.3.1 二项分布. . . 37
2.3.2 泊松分布. . . 39
IV R 语言统计学基础
2.3.3 几何分布与负二项分布. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .42
2.3.4 超几何分布. 45
2.4 常用连续型随机变量. . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.4.1 均匀分布. . . 46
2.4.2 指数分布. . . 47
2.4.3 正态分布. . . 49
2.5 随机变量函数的分布. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.5.1 离散型随机变量的情形. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .55
2.5.2 连续型随机变量的情形. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .56
2.6 分布的其他特征数. . 58
2.6.1 k 阶矩. . . . . .58
2.6.2 变异系数. . . 59
2.6.3 分位数. . . . . 59
2.6.4 偏度系数. . . 60
2.6.5 峰度系数. . . 60
2.7 多维随机变量初步. . 61
2.7.1 多维随机变量的基本概念. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .61
2.7.2 随机变量的独立性. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
2.7.3 条件分布. . . 64
2.7.4 协方差与线性相关系数. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .66
2.8 大数定律与中心极限定理. . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
2.8.1 大数定律. . . 70
2.8.2 中心极限定理. . . 71
2.9 本章习题. . . . . . . . 75
第3 章描述统计. . . . . . . 80
3.1 数据的基本类型.80
3.1.1 实验数据与观测数据. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.1.2 定性数据与定量数据. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.1.3 截面数据、时间序列数据与面板数据. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .82
3.1.4 定类、定序、定距与定比数据. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.2 数据的图表呈现.84
3.2.1 数据的表格呈现. 84
3.2.2 数据的图形呈现. 88
3.3 数据的数字描述.92
3.3.1 集中趋势描述. . . 92
3.3.2 离散趋势描述. . . 94
3.3.3 相对位置描述. . . 97
3.3.4 分布形状描述. . 101
3.4 本章习题. . . . . . .103
第4 章抽样分布. . . . . . 106
4.1 再论总体与样本. . . .106
4.1.1 作为数学抽象的统计总体. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.1.2 样本的二重性. . 107
4.1.3 简单随机样本的产生方式. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.1.4 样本统计量. . . . 110
4.2 抽样分布的基本思想. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.2.1 作为反事实框架的抽样分布. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.2.2 三大抽样分布. . 118
4.2.3 抽样分布的重要定理. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .121
4.3 常用统计量的抽样分布及其应用条件. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
4.3.1 单样本均值的抽样分布. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .124
4.3.2 独立双样本均值差的抽样分布. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.3.3 样本比例的抽样分布. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .127
4.3.4 样本方差的抽样分布. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .128
4.4 本章习题. . . . . . .130
第5 章参数估计. . . . . . 135
5.1 点估计. . . . . . . . . 135
5.1.1 点估计的基本含义. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .135
5.1.2 矩估计. . . . 136
5.1.3 最大似然估计. . 136
5.1.4 点估计量的评价标准. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .138
5.2 区间估计. . . . . . .139
5.2.1 区间估计的基本思想. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .140
5.2.2 对称型分布的置信区间构造. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
5.3 正态总体前提下的常用双侧置信区间. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
5.3.1 总体均值的置信区间. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .143
5.3.2 总体比例的置信区间. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .148
5.3.3 总体方差的置信区间. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .151
5.4 置信区间的相关问题. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
5.4.1 误差界限与样本容量. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .152
5.4.2 单侧置信区间. . 153
5.4.3 估计的稳健性. . 156
5.5 自助法置信区间. . . .157
5.5.1 自助法的基本思想. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .157
5.5.2 自助法置信区间的类型. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .165
5.6 本章习题. . . . . . .169
VI R 语言统计学基础
第6 章假设检验. . . . . . 174
6.1 假设检验的基本思想. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
6.1.1 小概率事件原理. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
6.1.2 参数检验与非参数检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .175
6.1.3 原假设、备择假设与零分布. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
6.1.4 两类错误与原假设显著性检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
6.1.5 p 值、检验统计量与拒绝域. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
6.1.6 置信区间与显著性检验的关系. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
6.1.7 正确理解显著性检验的结果. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
6.2 正态总体假定下的常用显著性检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
6.2.1 总体均值的显著性检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .184
6.2.2 总体比例的显著性检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .194
6.2.3 总体方差的显著性检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .202
6.3 统计功效与效应量. 206
6.3.1 统计功效. . 206
6.3.2 效应量. . . . 209
6.3.3 统计功效、效应量、样本容量与显著性水平的关系. . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
6.4 随机化检验. . . . 218
6.4.1 随机化实验与随机抽样的不同. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
6.4.2 随机化分布的基本思想. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .219
6.4.3 均值差的随机化检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .223
6.5 类型变量的显著性检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
6.5.1 2 拟合优度检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
6.5.2 2 独立性检验. 231
6.5.3 2 同质性检验. 237
6.5.4 类型变量的关联性度量与效应量. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
6.6 非参数检验. . . . 242
6.6.1 正态性检验. . . . 242
6.6.2 单总体分位数的符号检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
6.6.3 单总体中位数的符号秩检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
6.6.4 双独立总体的中位数秩和检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
6.7 本章习题. . . . . . .255
第7 章线性模型. . . . . . 261
7.1 相关与回归. . . . 261
7.1.1 线性相关性. . . . 261
7.1.2 等级相关性. . . . 264
7.1.3 回归的基础知识. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
7.2 一元线性回归. . 272
目录VII
7.2.1 一元线性回归的基本形式. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
7.2.2 一元线性回归的基本假定. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
7.2.3 一元线性回归的拟合优度. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
7.2.4 一元线性回归的假设检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
7.2.5 基于回归方程的估计和预测. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 286
7.3 多元线性回归. . 291
7.3.1 多元线性回归的基本形式. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
7.3.2 多元线性回归的基本假定. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
7.3.3 多元线性回归的参数估计与假设检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
7.3.4 虚拟变量回归. . 296
7.4 回归诊断简介. . 297
7.4.1 回归诊断的意义. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
7.4.2 回归诊断的内容. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300
7.5 单因子方差分析. . . .304
7.5.1 方差分析的基础术语. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .304
7.5.2 基本假定与检验形式. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .305
7.5.3 方差分析表及效应量. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .307
7.5.4 方差分析的基本流程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .308
7.5.5 多重比较. . 312
7.6 双因子方差分析. . . .316
7.6.1 双因子方差分析的基本思想. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316
7.6.2 双因子方差分析的检验形式、方差分析表与效应量. . . . . . . . . . . . . . . . . . . . . . . . . . . . 318
7.6.3 双因子方差分析的基本流程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320
7.6.4 方差分析的随机化检验. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .328
7.7 本章习题. . . . . . .332
內容試閱 :
与传统的介绍相比, 我更想说的是: 这是一本有思想、有技术、说\人话" 的新一代概率统计与数据分析入门教材. 我希望读者在阅读此书之后, 能够明白统计方法并不简单的只是一种硬邦邦冷、冰冰的\客观方法", 而是一种严谨且有弹性的思维方式; 学习统计方法的过程是一种处处充满惊喜的智力探索过程: 通过严格而系统的训练, 逐一打开统计方法的黑箱.为此, 本书努力在以下几个方面体现自身特色, 以充分拓展学生的数据想象力与分析力.① 贯彻统计思想重于统计计算的基本教学理念. 本书的主要目的并不是培养专业统计研究人才, 而是培养学生理性而健全的统计思维模式, 以及使用基本统计方法解决本学科领域的实际问题的能力. ② 以实证数据处理为中心阐述基本统计内容. 本书的主要内容完全针对行为与社会科学中的实际研究情境设计, 例子和习题同时具有可读性和知识性, 注重从一手文献、大型社会调查中提取相关数据作为训练数据. ③ 补充国内同类教材目前尚较为少见的重要内容. 这主要包括抽样分布产生、实验数据的随机化检验、自助分布置信区间、效应值与统计功效等内容. ④ 重视统计数据和统计结果的可视化呈现. 全书利用R 语言绘制了100 多个统计图形, 旨在培养学生的图形思维能力. ⑤ 强调统计结果的合理表达, 使普通读者能够更好地理解统计公式与计算结果在现实世界中的含义.本书的第1 章和第2 章是传统概率论的内容, 此部分内容需要一元函数微积分学的基础. 第3 章开始介绍统计学的内容. 一般而言, 统计学可分为两大块: 描述性统计descriptivestatistics 和推论性统计inferential statistics. 描述性统计是有关数据采集、组织和呈现的统计学分支, 主要涉及统计数字记录和归总、统计指标建立、统计图表制作等内容, 其重点在于两个方面: ① 数据的数字特征的概括, 也就是集中趋势与离散趋势的概括; ② 统计图表的制作与理解. 本书对各种统计指标背后的构造思想进行深入的剖析, 并结合R 软件说明其应用.推论性统计学主要涉及如何从样本数据推论到总体数据的工作. 通常而言, 我们不可能针对研究对象的全体即总体做研究, 而只可能根据总体的某个子集即样本做研究, 并且希望将根据样本得到的信息, 来归纳和推论总体的信息. 本书的所有推论统计观点都基于频率学派的研究, 这涉及第4?7 章. 其中, 第4 章讨论的抽样分布是推论统计学习的重点和难点,是社会科学研究中反事实框架的一个具体形式. 第5 章和第6 章分别介绍参数估计和假设检验的内容. 同时, 本书还介绍了随机化实验中常用的推论框架: 随机化分布, 并介绍了最近几十年发展迅速的自助法置信区间及R 语言实现, 以拓展学生的统计视野与软件技能. 第7 章主要介绍线性模型的基础内容, 主要包括线性回归和方差分析两大部分. 限于篇幅与自身学识, 本书并未涉及频率学派统计学之外的贝叶斯统计学的基本观点.本书文字内容基于Texlive 2015 平台写作而成, 统计分析和图形绘制基于Rstudio 平台完成. 本书并不刻意回避英文, 涉及的概率统计人物均不做翻译, 直接以英语出现. 关键术语均注明英文原文, 以便检索. 例题和练习中的变量名称也多用英文, 这是为了与R 中的变量命名原则相匹配. 本书所涉及的所有数据可从以下网址下载:http:pan.baidu.coms1c20ZuWK为节省篇幅, 软件安装指南、部分R 语言基础统计操作、推荐阅读书目、练习题详细答案等拓展性内容及书中未完全涉及的统计内容以PDF 形式存放于清华大学出版社官方网站, 请读者自行下载或向本人来信索取.本书多数章节的内容在出版之前已作为内部讲义在南开大学周恩来政府管理学院各专业试用. 由衷感谢各界本科生和研究生同学对本书内容与表述方式提出的改进建议. 尤其要感谢以下排名不分先后 我的助教、博士生张慧娟和王丛, 我的硕士生曹松峰、贾婷, 2015级南开大学应用心理学全体学术硕士, 以及我指导过的本科生付英涛、陈丹忆、李亚静、张光耀、柳婷、荣杨、彭芷晴、付鑫鹏、穆蔚琦、杨旋、刘奕男、孙超然、隋晓阳等同学. 他们协助我校订了讲义中的文字、公式、例题和习题, 同时还帮助我撰写了部分章节的LateX 文档与R 语言操作说明, 并共同设计了部分练习题. 在此特别要向这些热心好学的学生致以诚挚的谢意!感谢南开大学社会心理学系及周恩来政府管理学院诸位师长和同事对我的宽容, 使我能够自由地探索和实践自己的教学思想. 感谢张阔副教授的信任, 使我得以全程尝试用R 软件进行心理统计课程教学的机会. 还要感谢教材例题与习题中\神出鬼没"、备受调侃的\柴教授" 的原型, 我的同门师弟柴民权博士. 他虽已是兰州大学管理学院的教师, 仍不改逗萌本色, 为本书贡献了\柴教授" 的著名绰号, 以其独特方式证明他的持久影响力.撰写此书虽已尽全力, 成书在即仍旧诚惶诚恐. 既恐出现纰漏, 贻笑大方; 更恐误人子弟, 罪莫大焉. 相关建议或批评, 可直接发至本人邮箱xkdog@126.com 交流探讨. 如需更多国内外教学资料、统计习题、R 语言代码和考试试题, 也可直接发信索取, 我可承诺做到知无不言、全面分享.最后, 用我很喜欢的一句英文谚语作为结尾吧:Throw your hat over the fence!直译: 先把你的帽子扔过墙!这样你就有了翻墙而上的勇气.吕小康于南开大学津南校区2016 年8 月31 日
1.1基础知识回顾这一部分将回顾高中阶段的集合论术语与概率计算技巧.
1.1.1基本术语与符号表达概率论可以说是一门研究随机现象之数学模型的学科.所谓随机现象randomphenome
non,就是在一定条件下并不总是出现相同结果的现象.对随机现象进行观察、记录、实验
的过程,称为随机试验randomexperiment,而其中的每一次观测则称为trial由于中文缺
少单复数形式,故翻译仍为试验,但一个experiment可包含若干次trials.
从\几何意义上讲,某一随机现象的所有可能结果的集合,称为样本空间samplespace,
用大写希腊字母表示;而每一个不可再分解的试验结果,称为样本点samplepoint,用
小写希腊字母表示,通常会加上数字下标,如!1;!2,;!n表示不同的样本点.如此,
¢¢
随机事件randomevent,简称事件可以定义为某些样本点的集合,或样本空间的某个子
集subset.每一个样本点对应一个基本事件.样本空间的最大子集,即本身,称为必然
事件sureevent;样本空间的最小子集,即空集?emptyset,称为不可能事件impossible
event.
实际使用中,随机事件可能有不同的表达方式:直接用语言描述,同一事件可能有不同的描述;也可以用样本空间子集的形式表示,此时需要理解它所表达的实际含义.同时应当注意,这里的\试验与科学中的试验或实验并不是一回事,这里所称的事件与日常语言中的事件也不是一回事.概率论中的\事件与\试验",应当连在一起作为一对相互联系的概念进行理解.日常用语中的\事件",通常是指已经发生的情况,如\非典事件、\911事件,等等.而概率论中的事件,仅仅是关于某种状况的一种陈述,它可能已经发生过, 也可能没有发生过;可能发生,也可能不发生;发生与否,需等待\试验的结果才能确定.概率
R语言统计学基础
论中称\两个事件A与B共同发生或同时发生",并不是真的要求你能够\眼见为实地看到它出现,而只是在说:\A与B存在同时出现的逻辑上的可能",至于它实际上有没有发生过,并不是关注的重点.事件的产生总依赖于试验,这也不一定意味着个体要去亲身地观察和实验,而可以只是一种逻辑上的思考与想象,可以仅是一种理论上的\观察与\推测".也就是说,试验虽然可能涉及真实的、科学意义上的观测过程,但更多的只是一种理性上的思考过程而已.
直观上讲,用来表示随机事件结果的变量称为随机变量randomvariable,常用大写字母,如X、Y、Z表示.这其实是将具体的现象抽象化和符号化的过程.后面会用更加数学化的语言来重新定义随机变量,但不妨先做这一简单理解.事件之间的关系和运算有很多种,这里仅列出最常见的几种及其符号表示表1.1,以便参阅.
表1.1概率论中的事件符号及其含义
符号表示集合论意义概率论意义
A . B A = B A包含在B中A与B相等若A发生,则B一定发生;事件A蕴涵事件B A与B同时发生或同时不发生A B A B A B = .Ac或1A交集intersection并集union A与B不相交disjoint A的补集complement, AAc = A与B同时发生A与B至少有一个发生A与B互不相容互斥,mutuallyexclusive A与Ac为对立事件A . B差集di.erence A发生而B不发生
若样本空间可划分为一系列两两互不相容的事件A1;A2,;An,且A1 A2[¢¢¢¢¢
An =-, 即[n Ai=-,则称A1;A2,;An为的一个分割partition,或称A1;A2,;An