新書推薦:
《
维奥莱塔:一个女人的一生
》
售價:HK$
76.2
《
商业银行担保管理实务全指引
》
售價:HK$
144.5
《
信风万里:17世纪耶稣会中国年信研究(全二册)
》
售價:HK$
178.1
《
青铜之美 国宝里的中式美学
》
售價:HK$
177.0
《
海外中国研究·朱熹的思维世界(增订版)
》
售價:HK$
143.4
《
甲骨文丛书·沙漠之王:英美在中东的霸权之争
》
售價:HK$
110.9
《
汗青堂丛书147·光明时代:中世纪新史
》
售價:HK$
85.1
《
能成事的团队
》
售價:HK$
111.9
|
內容簡介: |
匡时方法研究系列之一。本书开篇使用种族歧视和呼吁投票运动作为例子,从实验和观察性研究两个角度讨论了因果性,接着讲解了度量和预测这两个社会科学研究数据分析中的主要目标。本书对数据分析和统计学理论进行了实践性介绍,主要针对的读者群体是本科生以及对社会科学和相关领域开展系统深入研究的研究生。本书涵盖领域包括经济学、社会学、公共政策以及数据科学,通过直接明了的实证分析,帮助读者学习用R项目语言分析数据,并阐释相关成果。
|
關於作者: |
Kosuke Imai 普林斯顿大学政治系教授,兼任东京大学法学政治学研究客座教授,在量化社科研究领域有深入的研究,是亚洲政治学与国际关系学术水平最高的顶尖级专家。
|
目錄:
|
目录
中文版序言 1
英文版序言 1
译校者序 11引言 1
1.1本书概述 3
1.2如何使用本书 6
1.3R的简介 9
1.3.1算术运算 10
1.3.2对象 11
1.3.3向量 14
1.3.4函数 16
1.3.5数据文件 19
1.3.6保存对象 22
1.3.7软件包 23
1.3.8编程及学习技巧 24
1.4总结 26
1.5练习 26
1.5.1自我汇报是否参加投票的偏差 26
1.5.2了解世界人口动态 282因果关系 31
2.1劳动力市场的种族歧视 31
2.2用R取得的数据子集 35
2.2.1逻辑值和运算符号 36
2.2.2关系运算符 38
2.2.3生成子集 39
2.2.4简单的条件语句 42
2.2.5因子变量 43
2.3因果效应与反事实 45
2.4随机对照试验 47
2.4.1随机化的作用 47
2.4.2社会压力和投票率 49
2.5观察性研究 53
2.5.1最低工资和失业 53
2.5.2混淆偏误 56
2.5.3前后设计和倍差设计 59
2.6单变量的描述性统计量 62
2.6.1分位数 62
2.6.2标准差 65
2.7总结 66
2.8习题 67
2.8.1早教小班化的有效性 67
2.8.2改变对同性恋婚姻的看法 69
2.8.3刺杀领导人成功率的自然实验 703度量 73
3.1战争时期平民受伤情况的度量 73
3.2处理R中缺失的数据 76
3.3可视化单变量分布 78
3.3.1条形图 78
3.3.2直方图 80
3.3.3箱形图 83
3.3.4打印及保存图表 85
3.4调查抽样 86
3.4.1随机化的作用 87
3.4.2拒访和其他偏误来源 91
3.5度量政治极化 93
3.6概括双变量关系 95
3.6.1散点图 95
3.6.2相关性 98
3.6.3分位数分位数图 102
3.7聚类 104
3.7.1R中的矩阵 105
3.7.2R中的列表 107
3.7.3k均值算法 108
3.8总结 112
3.9练习 113
3.9.1改变对待同性恋婚姻的看法(再探) 113
3.9.2中国和墨西哥的政治效力 114
3.9.3联合国大会投票表决 1164预测 119
4.1预测选举结果 119
4.1.1R的循环语句 120
4.1.2R中的一般条件语句 123
4.1.3基于民意调查的预测 126
4.2线性回归 134
4.2.1面部长相与选举结果的联系 134
4.2.2相关性与散点图 136
4.2.3最小二乘法 138
4.2.4趋中回归 143
4.2.5R中的合并数据集 144
4.2.6模型拟合 151
4.3回归与因果关系 156
4.3.1随机化的实验 156
4.3.2多元预测回归 159
4.3.3异质性干预效应 164
4.3.4断点回归设计 169
4.4总结 174
4.5练习 174
4.5.1基于博彩市场的预测 174
4.5.2墨西哥的选举和条件现金转移计划 176
4.5.3巴西政府转移和减少贫困率 1795数据探索 181
5.1文本数据 181
5.1.1《联邦党人文集》悬而未决的作者问题 181
5.1.2文本项矩阵 185
5.1.3挖掘主题 186
5.1.4作者预测 191
5.1.5交叉验证 193
5.2网络数据 196
5.2.1文艺复兴时期佛罗伦萨的婚姻网络 197
5.2.2无方向的绘图和中心性度量 198
5.2.3推特关注网络 202
5.2.4有方向的图和中心性 204
5.3空间数据 210
5.3.11854年伦敦暴发霍乱 210
5.3.2R中的空间数据 213
5.3.3R中的色彩 216
5.3.4美国总统选举 219
5.3.5沃尔玛的扩张 221
5.3.6R中的动画 223
5.4总结 225
5.5练习 226
5.5.1分析宪法的序言 226
5.5.2国际贸易网络 228
5.5.3制作美国总统选举跨时间的地图 2296概率 232
6.1概率 232
6.1.1频率统计与贝叶斯统计 232
6.1.2定义和公理 234
6.1.3排列 237
6.1.4有和没有替换的抽样 240
6.1.5组合 241
6.2条件概率 244
6.2.1条件、边际和联合概率 244
6.2.2独立性 251
6.2.3贝叶斯法则 255
6.2.4用姓氏和居住地来预测种族 257
6.3随机变量和概率分布 267
6.3.1随机变量 267
6.3.2伯努利和均匀分布 268
6.3.3二项分布 272
6.3.4正态分布 276
6.3.5期望和方差 281
6.3.6预测充满不确定性的选举结果 285
6.4大样本定理 288
6.4.1大数定律 288
6.4.2中心极限定理 290
6.5总结 294
6.6练习 295
6.6.1恩格玛机中的数学 295
6.6.2博彩市场选举预测的概率模型 296
6.6.3俄罗斯的选举舞弊 2987不确定性 301
7.1估计 301
7.1.1无偏性和一致性 302
7.1.2标准误 308
7.1.3置信区间 313
7.1.4误差边际和民意调查中的样本规模计算 318
7.1.5随机对照试验分析 322
7.1.6基于学生t分布的分析 325
7.2假设检验 328
7.2.1品茶试验 328
7.2.2总体框架 331
7.2.3单样本检验 335
7.2.4双样本检验 341
7.2.5假设检验的陷阱 346
7.2.6效力分析 348
7.3含不确定性的线性回归模型 354
7.3.1作为生成模型的线性回归模型 354
7.3.2估计系数的无偏性 359
7.3.3估计系数的标准误 362
7.3.4关于参数的推断 364
7.3.5关于预测的推断 367
7.4总结 373
7.5练习 373
7.5.1性别比和中国农作物的价格 373
7.5.2学术研究中的抽屉偏误和发表偏见 375
7.5.31932年德国魏玛共和国的大选 377
8下一步 380
词汇表 383
|
|