新書推薦:
《
商业银行担保管理实务全指引
》
售價:HK$
144.5
《
信风万里:17世纪耶稣会中国年信研究(全二册)
》
售價:HK$
178.1
《
青铜之美 国宝里的中式美学
》
售價:HK$
177.0
《
海外中国研究·朱熹的思维世界(增订版)
》
售價:HK$
143.4
《
甲骨文丛书·沙漠之王:英美在中东的霸权之争
》
售價:HK$
110.9
《
汗青堂丛书147·光明时代:中世纪新史
》
售價:HK$
85.1
《
能成事的团队
》
售價:HK$
111.9
《
现代无人机鉴赏(珍藏版)
》
售價:HK$
78.2
|
編輯推薦: |
本书没有对模式识别和机器学习进行百科全书式的介绍,而是精选了核心内容,使读者在学习本书后能够精通核心知识点。本书广泛使用Python脚本和真实的生物信息学和材料信息学数据集来说明理论的要点。
|
內容簡介: |
模式识别和机器学习是人工智能应用的基础。本书将模式识别任务按照监督学习和无监督学习两种方式进行组织。第1章讨论模式识别和机器学习的内在关系,介绍了两者的基础知识和模式识别的设计过程。第2章和第3章介绍了最优化的和常规的基于实例的分类问题。第4~6章检验了参数的、非参数的和函数逼近的分类规则。之后在第7章和第8章就分类的误差估计和模型选择对分类模型的性能进行讨论。第9章介绍了能够提高分类模型的性能并减少存储空间的降维技术。第10章和第11章分别介绍了聚类分析技术和回归模型。本书适合相关专业高年级本科生和研究生,以及该领域的从业人员阅读。
|
目錄:
|
目录
Fundamentals of Pattern Recognition and Machine Learning
译者序
前言
第1章概述111模式识别与机器学习1
12数学基础设置1
13预测2
14预测误差2
15监督学习与无监督学习3
16复杂性权衡3
17设计周期4
18应用实例5
181生物信息学5
182材料信息学7
19文献注释9
第2章最优分类1021无特征分类10
22有特征分类10
23贝叶斯分类器13
24贝叶斯误差16
25高斯模型19
251同方差情况20
252异方差情况22
26其他主题22
261极小极大分类22
262F误差24
263贝叶斯决策理论26
*264分类问题的严格表达27
27文献注释28
28练习29
29Python作业33
第3章基于实例的分类3631分类规则36
32分类错误率38
*33一致性38
34没有免费午餐定理41
35其他主题42
351集成分类42
352混合抽样与独立抽样43
36文献注释44
37练习44
38Python作业45
第4章参数分类4741参数替换规则47
42高斯判别分析48
421线性判别分析48
422二次判别分析51
43逻辑斯谛分类53
44其他主题54
441正则化判别分析54
*442参数规则的一致性55
443贝叶斯参数规则57
45文献注释59
46练习60
47Python作业62
第5章非参数分类6451非参数替换规则64
52直方图分类65
53最近邻分类66
54核分类68
55CoverHart定理70
*56Stone定理73
57文献注释74
58练习75
59Python作业76
第6章函数逼近分类7861支持向量机78
611可分数据的线性支持
向量机78
612一般线性支持向量机80
613非线性支持向量机82
62神经网络86
621反向传播训练89
622卷积神经网络92
*623神经网络的普遍逼近
性质94
624普遍一致性定理96
63决策树97
64有序分类器100
65文献注释101
66练习102
67Python作业104
第7章分类误差估计10871误差估计规则108
72误差估计性能109
721偏差分布109
722偏差、方差、均方根和
尾概率110
*723一致性111
73测试集误差估计112
74再代入误差估计113
75交叉验证114
76自助方法116
77增强误差估计118
78其他主题121
781凸误差估计器121
782平滑误差估计器123
783贝叶斯误差估计123
79文献注释126
710练习127
711Python作业129
第8章分类模型选择13181分类复杂性131
82VapnikChervonenkis理论134
*821有限模型选择134
822打散系数与VC维度135
823几种分类规则中的VC
参数136
824VapnikChervonenkis
定理139
825没有免费午餐定理139
83模型选择方法140
831验证误差最小化140
832训练集误差最小化141
833结构性风险最小化141
84文献注释142
85练习143
第9章降维14591面向分类任务的特征提取145
92特征选择146
921穷举搜索146
922单变量贪婪搜索147
923多变量贪婪搜索149
924特征选择与分类复杂性150
925特征选择与误差估计150
93主成分分析152
94多维缩放155
95因子分析156
96文献注释158
97练习159
98Python作业160
第10章聚类162101KMeans算法162
102高斯混合模型165
1021期望最大化方法166
1022与KMeans的关系170
103层次聚类171
104自组织映射173
105文献注释174
106练习175
107Python作业176
第11章回归178111最优回归178
112
|
內容試閱:
|
前言
Fundamentals of Pattern Recognition and Machine Learning
“只有受过教育的人才是自由的。”
——古希腊哲学家爱比克泰德(Epictetus)
模式识别和机器学习领域的发展有着悠久而成就卓著的历史。单就教材而言,已有很多该领域的优秀教材,那么我们需要回答为什么仍需要一本全新的教材。本书致力于通过简明的介绍,将理论和实践相结合并且让其更适用于课堂教学。本书的重点是基于Python编程语言对近期的新方法和应用实例予以展示。本书不会试图对模式识别和机器学习进行百科全书式的面面俱到的介绍,因为该领域发展很快,这种介绍方式是不可能实现的。一本简明的教科书必须有严格的选材要求,本书所选的主题在一定程度上不可避免会取决于我自己的经验和喜好,但我相信它能够使读者精通这一领域所必须掌握的核心知识。本书只要求读者具备本科水平的微积分和概率论知识,同时附录中包含了研究生水平的概率论知识的简要回顾以及书中所需的其他数学方法。
本书是从我在得克萨斯农工大学讲授了十多年的模式识别、生物信息学和材料信息学研究生课程的讲稿发展而来的。本书旨在通过恰当的选题(详细见后),在模式识别或机器学习方面,满足一个或两个学期的具有高年级本科层次或研究生层次的初级课程的教学需求。虽然本书是为课堂教学设计的,但它也可有效地用于自学。
本书并没有对理论知识进行回避,因为对理论知识的理解对于模式识别和机器学习的教学过程尤为重要。模式识别和机器学习领域充满经典的定理,如CoverHart定理、Stone定理及其推论、VapnikChervonenkis定理等。然而,本书试图在理论和实践之间获取平衡。特别是,用贯穿全书的生物信息学和材料信息学的应用数据集实例来解释理论。这些数据集也被用在章末的Python作业中。书中所有的插图都是使用Python脚本生成的,可以从本书的网站下载。鼓励读者用这些脚本做试验并在Python作业中使用它们。本书的网站还包含来自生物信息学和材料信息学应用的数据集,绘图和Python作业中会用到它们。根据我在课堂上的经验,一旦学生完成了Python作业并使用了来自真实应用的数据,他们对主题的理解就会显著提升。
本书的组织结构如下。第1章是对主题动机的概括性介绍。第2~8章涉及分类问题。第2章和第3章是分类的基础章节,主要涉及最优化的和常规的基于实例的分类问题。第4~6章检验了三类主要的分类规则:参数的、非参数的和函数逼近的。第7章和第8章涉及分类的误差估计和模型选择。第9章不仅对分类问题的降维方法进行研究,也包括关于无监督方法的学习材料。最后,第10章和第11章讨论了聚类和回归问题。教师或读者可以灵活地从这些章节中选择主题,并以不同的顺序使用它们。特别是,部分章节末尾的“其他主题”部分涵盖了杂项主题内容,在教学中可以包括也可以不包括这些主题,不会影响课程的连续性。此外,为了方便教师和读者,书中用星号标记了专业性更强的章节,这些部分可以在初读时跳过。
大多数章节末尾的练习部分都包含各种难度的问题,练习中的一些是本章所讨论概念的直接应用,而另一些则介绍了新的概念和理论的扩展,其中有些可能值得在课堂上讨论。大多数章节末尾的Python作业要求读者使用Python语言和scikitlearn工具包实现本章中讨论的方法,并将它们应用于生物信息学和材料信息学应用中的合成和真实数据集。
根据我的教学经验,建议在课堂上按照如下方式使用本书:
1一个学期的课程重点可集中在分类问题上,讲授内容包括第2~9章,包括大多数标有星号的小节和其他主题部分。
2面向应用的一学期课程,授课内容可跳过第2~8章中的大部分或所有标有星号的小节和其他主题部分,涵盖第9~11章的内容,同时重点讲解各章的Python作业。
3涵盖整本书的两个学期课程的教学内容包括大部分或所有标有星号的小节以及其他主题部分。
本书的出版要归功于几位前辈。首先,Duda和Hart的经典教材(1973年首次出版,2001年的第2版加入了Stork作为共同作者)几十年来一直是该领域的标准参考材料。此外,Devroye,Gyrfi and Lugosi[1996]本书以“作者[年份]”的形式来指代该作者于该年份发表或出版的论文或著作。 现在仍然是非参数模式识别的黄金标准。其他对本书存在影响的资料来源包括McLachlan[1992]、Bishop[2006]、Webb[2002]和James et al[2013]。
我要感谢所有现在和过去的合作者,他们帮助我塑造对模式识别和机器学习领域的理解架构。同样,我也要感谢所有的学生,无论是由我指导过他们的研究,还是参加过我讲座的学生,他们都对本书的内容提出了自己的观点和修改意见。我要感谢Ed Dougherty、Louise Strong、John Goutsias、Ascendino Dias e Silva、Roberto Lotufo、Junior Barrera和 Severino Toscano,我从他们身上受益匪浅。感谢Ed Dougherty、Don Geman、Al Hero和 Gábor Lugosi,在编写本书的时候他们提供了对本书的评论和对我的鼓励。我很感谢Caio Davi,他为本书绘制了几幅插图。非常感谢当我在纽约市处于困难时期时由Paul Drougas在施普林格提供的专家援助。最后,感谢我的妻子Flávia以及我的孩子Maria Clara和Ulisses,感谢他们在本书的写作过程中对我充满耐心,并提供了一如既往的支持。
Ulisses BragaNeto
得克萨斯学院站
2020年7月
|
|