新書推薦:
《
分析性一体的涌现:进入精神分析的核心
》
售價:HK$
125.4
《
火枪与账簿:早期经济全球化时代的中国与东亚世界
》
售價:HK$
79.4
《
《全面与进步跨太平洋伙伴关系协定》国有企业条款研究
》
售價:HK$
101.2
《
银行业架构网络BIAN(全球数字化时代金融服务业框架)(数字化转型与创新管理丛书)
》
售價:HK$
101.2
《
金托邦:江湖中的沉重正义
》
售價:HK$
62.1
《
易经今解:释疑·解惑·见微
》
售價:HK$
90.9
《
东欧史(全二册)-“中间地带”的困境
》
售價:HK$
227.7
《
虚拟资本:金融怎样挪用我们的未来
》
售價:HK$
79.4
|
編輯推薦: |
本书围绕神经网络、智能推理、矩阵计算三大主线,提供近25个经典的算法讲解。解剖有代表性的算法库:Scikit-Learn算法库、OpenCV机器视觉、Theano深度学习库。作为本土原创图书,本书更符合国内人的阅读习惯,适合作为机器学习算法设计的入门读物。
|
內容簡介: |
本书是机器学习原理和算法编码实现的基础性读物,内容分为两大主线:单个算法的原理讲解和机器学习理论的发展变迁。算法除包含传统的分类、聚类、预测等常用算法之外,还新增了深度学习、贝叶斯网、隐马尔科夫模型等内容。对于每个算法,均包括提出问题、解决策略、数学推导、编码实现、结果评估几部分。数学推导力图做到由浅入深,深入浅出。结构上数学原理与程序代码一一对照,有助于降低学习门槛,加深公式的理解,起到推广和扩大机器学习的作用。
|
關於作者: |
郑捷,www.threedweb.cn网站负责人,研究方向是机器学习与自然语言处理。当前负责的核心产品是高精度自然语言认知系统的设计与研发,研发目标是高精度(识别率在85%~95%)的统一架构的NLP认知系统。
|
目錄:
|
第1章 机器学习的基础1
1.1 编程语言与开发环境2
1.1.1 搭建Python开发环境2
1.1.2 安装Python算法库4
1.1.3 IDE配置及其安装测试5
1.2 对象、矩阵与矢量化编程8
1.2.1 对象与维度8
1.2.2 初识矩阵10
1.2.3 矢量化编程与GPU运算13
1.2.4 理解数学公式与NumPy矩阵运算14
1.2.5 Linalg线性代数库18
1.3 机器学习的数学基础20
1.3.1 相似性的度量21
1.3.2 各类距离的意义与Python实现22
1.3.3 理解随机性29
1.3.4 回顾概率论30
1.3.5 多元统计基础32
1.3.6 特征间的相关性33
1.3.7 再谈矩阵——空间的变换35
1.3.8 数据归一化40
1.4 数据处理与可视化42
1.4.1 数据的导入和内存管理42
1.4.2 表与线性结构的可视化45
1.4.3 树与分类结构的可视化46
1.4.4 图与网络结构的可视化47
1.5 Linux操作系统下部署Python机器学习开发环境48
1.5.1 Linux发行版的选择48
1.5.2 CentOS部署多版本Python实例49
1.5.3 安装NumPy、SciPy、Matplotlib开发包52
1.5.4 安装Scikit-Learn开发包54
1.6 结语55
第2章 中文文本分类56
2.1 文本挖掘与文本分类的概念56
2.2 文本分类项目58
2.2.1 文本预处理58
2.2.2 中文分词介绍61
2.2.3 Scikit-Learn库简介66
2.2.4 向量空间模型70
2.2.5 权重策略:TF-IDF方法71
2.2.6 使用朴素贝叶斯分类模块74
2.2.7 分类结果评估76
2.3 分类算法:朴素贝叶斯78
2.3.1 贝叶斯公式推导78
2.3.2 朴素贝叶斯算法实现79
2.3.3 算法的改进82
2.3.4 评估分类结果82
2.4 分类算法:kNN83
2.4.1 kNN算法原理83
2.4.2 kNN算法的Python实现86
2.4.3 评估分类结果88
2.5 结语88
第3章 决策树的发展89
3.1 决策树的基本思想89
3.1.1 从一个实例开始90
3.1.2 决策树的算法框架95
3.1.3 信息熵测度96
3.2 ID3决策树98
3.2.1 ID3算法98
3.2.2 ID3的实现101
3.2.3 决策树主方法101
3.2.4 训练决策树103
3.2.5 持久化决策树104
3.2.6 决策树分类105
3.2.7 算法评估106
3.3 C4.5算法106
3.3.1 信息增益率106
3.3.2 C4.5的实现108
3.3.3 训练决策树108
3.3.4 分类数据109
3.4 Scikit-Learn与回归树110
3.4.1 回归算法原理110
3.4.2 *小剩余方差法111
3.4.3 模型树113
3.4.4 剪枝策略113
3.4.5 Scikit-Learn实现115
3.5 结语117
第4章 推荐系统原理118
4.1 推荐系统概述119
4.1.1 从亚马逊网站认识推荐系统119
4.1.2 推荐系统的架构122
4.1.3 开源推荐系统125
4.2 协同过滤及其算法126
4.2.1 协同过滤126
4.2.2 数据预处理127
4.2.3 使用Scikit-Learn的KMeans聚类127
4.2.4 User CF原理129
4.2.5 Item CF原理131
4.2.6 SVD原理与计算132
4.3 KMeans算法详解135
4.3.1 KMeans算法流程135
4.3.2 辅助函数136
4.3.3 聚类主函数137
4.3.4 评估分类结果139
4.4 聚类的改进:二分KMeans算法141
4.4.1 二分聚类主函数141
4.4.2 评估分类结果142
4.5 SVD算法详解143
4.5.1 SVD算法回顾143
4.5.2 常用距离函数146
4.5.3 SVD数据集146
4.5.4 SVD算法主函数147
4.5.5 评估结果147
4.6 结语148
第5章 梯度寻优149
5.1 **化与计算复杂性149
5.1.1 **化理论149
5.1.2 **化的数学描述150
5.1.3 凸集与分离定理151
5.1.4 凸函数及其性质153
5.1.5 局部**与全局**155
5.1.6 计算复杂性与NP问题156
5.1.7 逐次逼近法159
5.2 Logistic梯度下降法163
5.2.1 梯度下降法164
5.2.2 线性分类器166
5.2.3 Logistic函数——世界不是非黑即白169
5.2.4 算法流程171
5.2.5 对测试集进行分类175
5.3 算法分析175
5.3.1 超平面的变化趋势176
5.3.2 超平面的收敛评估177
5.3.3 权重向量的收敛评估179
5.3.4 算法总体评价180
5.4 随机梯度下降法:算法改进与评估180
5.4.1 主函数181
5.4.2 程序输出182
5.4.3 步长变化率183
5.4.4 权重收敛评估184
5.4.5 权重分量的变化趋势185
5.4.6 算法总体评价187
5.5 结语187
第6章 神经网络初步189
6.1 神经网络简史189
6.1.1 起源与早期发展189
6.1.2 中期发展190
6.1.3 当前的发展与反思192
6.2 BP神经网络理论192
6.2.1 线性不可分问题192
6.2.2 BP网络构成193
6.2.3 BP网络的训练过程196
6.3 BP网络的实现和评估199
6.3.1 BP网络类与主要方法199
6.3.2 设计BP网络199
6.3.3 辅助函数202
6.3.4 主函数203
6.3.5 分类器204
6.3.6 执行分类并输出结果205
6.3.7 BP网络评估207
6.4 自组织特征映射神经网络208
6.4.1 SOM网络框架208
6.4.2 SOM类211
6.4.3 功能函数212
6.4.4 SOM网络的实现212
6.4.5 聚类结果213
6.5 Boltzmann机算法215
6.5.1 问题的提出215
6.5.2 模拟退火原理216
6.5.3 Boltzmann分布与退火过程217
6.5.4 Boltzmann机类与功能函数219
6.5.5 *短路径的实现222
6.5.6 执行算法223
6.5.7 评估结果224
6.6 结语225
第7章 预测的技术与哲学226
7.1 线性系统的预测226
7.1.1 回归与现代预测学226
7.1.2 *小二乘法227
7.1.3 代码实现229
7.1.4 正规方程组法231
7.1.5 正规方程组的代码实现232
7.1.6 算法评估232
7.2 径向基网络233
7.2.1 RBF网络233
7.2.2 辅助函数236
7.2.3 使用RBF预测236
7.2.4 评估预测结果238
7.3 岭回归238
7.3.1 验证多重共线性239
7.3.2 岭回归理论240
7.3.3 岭际分析240
7.3.4 k值的判定242
7.3.5 辅助函数243
7.3.6 岭回归的实现与k值计算243
7.3.7 算法评估244
7.4 预测的哲学245
7.4.1 从《周易》谈起246
7.4.2 两仪生四象249
7.4.3 周期三与混沌251
7.4.4 Logistic中的吸引子254
7.4.5 三生万物258
7.4.6 八卦图及其推演261
7.5 结语263
第8章 **分类器——支持向量机265
8.1 支持向量机的理论基础266
8.1.1 经验风险**266
8.1.2 关键定理与VC维267
8.1.3 结构风险**270
8.2 SVM的数学推导272
8.2.1 **间隔超平面272
8.2.2 拉格朗日乘子法275
8.2.3 KKT条件与对偶变换276
8.2.4 分类器函数277
8.2.5 映射到高维空间278
8.2.6 核函数法280
8.2.7 离群点的松弛变量281
8.3 SMO算法284
8.3.1 SMO求解SVM284
8.3.2 构造SMO类288
8.3.3 主函数290
8.3.4 训练数据291
8.3.5 分类并评估算法293
8.4 SVM中文文本分类293
8.4.1 回顾中文文本分类294
8.4.2 Scikit-Learn SVM分类294
8.4.3 评估结果295
8.5 结语296
第9章 人脸识别中的机器学习297
9.1 模式识别概述297
9.1.1 认知与模式29
|
|