新書推薦:
《
别读博,会脱单
》
售價:HK$
57.2
《
甲骨文丛书·德意志与神圣罗马帝国(第1卷):从马克西米利安一世到《威斯特伐利亚和约》(1493~1648年)(全2册)
》
售價:HK$
260.8
《
面向2035特种加工技术路线图
》
售價:HK$
96.8
《
不可能的戏剧:洛尔迦先锋戏剧三种
》
售價:HK$
60.5
《
康德希望问题研究
》
售價:HK$
107.8
《
艺术家的调色板
》
售價:HK$
184.8
《
大数据开发实战
》
售價:HK$
130.9
《
古代人的一天(第3辑):朝代的七天
》
售價:HK$
154.0
|
編輯推薦: |
随着计算能力的快速增长,大量任务都可在台式机上完成;在这样的背景下,机器学习应运而生,成为当今炙手可热的话题。但初出茅庐的新手常对机器学习感到十分畏惧;为给这些新手扫清障碍,《Python机器学习》采用循序渐进的方式,先讲解底层技术,然后引导读者学习更高级的机器学习技巧。
本书首先介绍Python机器学习的一些基本库,包括NumPy、Pandas和matplotlib。一旦牢固地掌握了基础知识,即可开始基于Python和Scikit-learn库进行机器学习,深入了解各种机器学习算法如回归、聚类和分类的底层工作原理。本书专门用一章的篇幅讲解如何使用Azure Machine Learning Studio进行机器学习;利用该平台,开发人员不必编写代码即可开始构建机器学习模型。本书*后讨论如何部署供客户端应用程序使用的已构建模型。
|
內容簡介: |
《Python机器学习》面向机器学习新手,主要内容如下:
● Python机器学习的一些基本库,包括NumPy、Pandas和matplotlib库
● 常见的机器学习算法,包括回归、聚类、分类和异常检测
● 使用Python和Scikit-learn库进行机器学习
● 将机器学习模型部署为Web服务
● 使用Microsoft Azure Machine Learning Studio进行机器学习
● 演习机器学习模型构建方案的实例
|
關於作者: |
Wei-Meng Lee是一名技术专家,也是Developer Learning Solutions公司http:www.learn2development.net的创始人,该公司专门从事最新技术的实践培训。
Wei-Meng具有多年的培训经验,他的培训课程特别强调边做边学。他动手学习编程的方法使理解这个主题比仅阅读书籍、教程和文档容易得多。
Wei-Meng这个名字经常出现在网上和印刷出版物,如DevX.com、MobiForge.com和CoDe杂志。
|
目錄:
|
第1章 机器学习简介1
1.1 什么是机器学习?2
1.1.1 在本书中机器学习将解决什么问题?3
1.1.2 机器学习算法的类型4
1.2 可得到的工具7
1.2.1 获取Anaconda8
1.2.2 安装Anaconda8
1.3 本章小结17
第2章 使用NumPy扩展Python19
2.1 NumPy是什么?19
2.2 创建NumPy数组20
2.3 数组索引22
2.3.1 布尔索引22
2.3.2 切片数组23
2.3.3 NumPy切片是一个引用25
2.4 重塑数组26
2.5 数组数学27
2.5.1 点积29
2.5.2 矩阵30
2.5.3 累积和31
2.5.4 NumPy排序32
2.6 数组赋值34
2.6.1 通过引用复制34
2.6.2 按视图复制浅复制35
2.6.3 按值复制深度复制37
2.7 本章小结37
第3章 使用Pandas处理表格数据39
3.1 Pandas是什么?39
3.2 Pandas Series40
3.2.1 使用指定索引创建Series41
3.2.2 访问Series中的元素41
3.2.3 指定Datetime范围作为Series的索引42
3.2.4 日期范围43
3.3 Pandas DataFrame44
3.3.1 创建DataFrame45
3.3.2 在DataFrame中指定索引46
3.3.3 生成DataFrame的描述性统计信息47
3.3.4 从DataFrame中提取48
3.3.5 选择DataFrame中的单个单元格54
3.3.6 基于单元格值进行选择54
3.3.7 转置DataFrame54
3.3.8 检查结果是DataFrame还是Series55
3.3.9 在DataFrame中排序数据55
3.3.10 将函数应用于DataFrame57
3.3.11 在DataFrame中添加和删除行和列60
3.3.12 生成交叉表63
3.4 本章小结64
第4章 使用matplotlib显示数据67
4.1 什么是matplotlib?67
4.2 绘制折线图67
4.2.1 添加标题和标签69
4.2.2 样式69
4.2.3 在同一图表中绘制多条线71
4.2.4 添加图例72
4.3 绘制柱状图73
4.3.1 在图表中添加另一个柱状图74
4.3.2 更改刻度标签76
4.4 绘制饼图77
4.4.1 分解各部分79
4.4.2 显示自定义颜色79
4.4.3 旋转饼状图80
4.4.4 显示图例81
4.4.5 保存图表83
4.5 绘制散点图83
4.5.1 合并图形84
4.5.2 子图85
4.6 使用Seaborn绘图86
4.6.1 显示分类图87
4.6.2 显示lmplot89
4.6.3 显示swarmplot90
4.7 本章小结92
第5章 使用Scikit-learn开始机器学习93
5.1 Scikit-learn简介93
5.2 获取数据集93
5.2.1 使用Scikit-learn数据集94
5.2.2 使用Kaggle数据集97
5.2.3 使用UCI机器学习存储库97
5.2.4 生成自己的数据集97
5.3 Scikit-learn入门100
5.3.1 使用LinearRegression类对模型进行拟合101
5.3.2 进行预测101
5.3.3 绘制线性回归线102
5.3.4 得到线性回归线的斜率和截距103
5.3.5 通过计算残差平方和检验模型的性能104
5.3.6 使用测试数据集评估模型105
5.3.7 持久化模型106
5.4 数据清理108
5.4.1 使用NaN清理行108
5.4.2 删除重复的行110
5.4.3 规范化列112
5.4.4 去除异常值113
5.5 本章小结117
第6章 有监督的学习线性回归119
6.1 线性回归的类型119
6.2 线性回归120
6.2.1 使用Boston数据集120
6.2.2 数据清理125
6.2.3 特征选择126
6.2.4 多元回归129
6.2.5 训练模型131
6.2.6 获得截距和系数133
6.2.7 绘制三维超平面134
6.3 多项式回归136
6.3.1 多项式回归公式138
6.3.2 Scikit-learn中的多项式回归138
6.3.3 理解偏差和方差142
6.3.4 对Boston数据集使用多项式多元回归145
6.3.5 绘制三维超平面146
6.4 本章小结149
第7章 有监督的学习使用逻辑回归进行分类151
7.1 什么是逻辑回归?151
7.1.1 理解概率153
7.1.2 logit函数153
7.1.3 sigmoid曲线155
7.2 使用威斯康星乳腺癌诊断数据集156
7.2.1 检查特征之间的关系157
7.2.2 使用一个特征训练161
7.2.3 使用所有特性训练模型164
7.3 本章小结174
第8章 有监督的学习使用支持向量机分类175
8.1 什么是支持向量机?175
8.1.1 最大的可分性176
8.1.2 支持向量177
8.1.3 超平面的公式178
8.1.4 为SVM使用Scikit-learn179
8.1.5 绘制超平面和边距182
8.1.6 进行预测183
8.2 内核的技巧184
8.2.1 添加第三个维度185
8.2.2 绘制三维超平面187
8.3 内核的类型189
8.3.1 C193
8.3.2 径向基函数RBF内核195
8.3.3 gamma196
8.3.4 多项式内核198
8.4 使用SVM解决实际问题199
8.5 本章小结202
第9章 有监督的学习使用k-近邻kNN分类203
9.1 k-近邻是什么?203
9.1.1 用Python实现kNN204
9.1.2 为kNN使用Scikit-learn的KNeighborsClassifier类209
9.2 本章小结218
第10章 无监督学习使用k-means聚类219
10.1 什么是无监督学习?219
10.1.1 使用k-means的无监督学习220
10.1.2 k-means中的聚类是如何工作的220
10.1.3 在Python中实现k-means223
10.1.4 在Scikit-learn中使用k-means228
10.1.5 利用Silhouette系数评价聚类的大小230
10.2 使用k-means解决现实问题234
10.2.1 导入数据234
10.2.2 清理数据235
10.2.3 绘制散点图236
10.2.4 使用k-means聚类236
10.2.5 寻找最优尺寸类238
10.3 本章小结239
第11章 使用 Azure Machine Learning Studio241
11.1 什么是Microsoft Azure Machine Learning Studio?241
11.1.1 以泰坦尼克号实验为例241
11.1.2 使用Microsoft Azure Machine Learning Studio243
11.1.3 训练模型254
11.1.4 将学习模型作为Web服务发布258
11.2 本章小结263
第12章 部署机器学习模型265
12.1 部署ML265
12.2 案例研究266
12.2.1 加载数据267
12.2.2 清理数据267
12.2.3 检查特征之间的相关性269
12.2.4 绘制特征之间的相关性270
12.2.5 评估算法273
12.2.6 训练并保存模型275
12.3 部署模型277
12.4 创建客户机应用程序来使用模型279
12.5 本章小结281
|
內容試閱:
|
《Python机器学习》介绍了机器学习,这是近年来最热门的话题之一。目前设备的计算能力呈指数级数增长,同时价格在不断下降,这是了解机器学习的最佳时机。机器学习任务通常需要非常强大的处理能力,但现在可以在台式机上完成。然而,机器学习并不适合胆小的人你需要具备良好的数学、统计学基础和编程知识。市场上的大多数书要么太肤浅,要么过于深奥让初学者望而生畏。
《Python机器学习》将对这个问题采取温和的态度。首先,《Python机器学习》介绍Python中使用的一些使机器学习成为可能的基本库。特别是,学习如何使用NumPy库操作数字数组,如何使用Pandas库处理表格数据。完成这些之后,学习如何使用matplotlib库可视化数据,它允许绘制不同类型的图表和图形,以便轻松地可视化数据。
一旦牢固地掌握了基础知识,就可以开始使用Python和Scikit-learn库进行机器学习。这样可以深入了解各种机器学习算法幕后的工作原理。
《Python机器学习》将介绍常用的机器学习算法,如回归、聚类和分类。
《Python机器学习》还包含一章,介绍如何使用Microsoft Azure Machine Learning Studio进行机器学习,该工具允许开发人员开始使用拖放操作来构建机器学习模型,而不需要编写代码。最重要的是,不需要深入掌握机器学习知识。
最后讨论如何部署所构建的模型,以便运行在移动和桌面设备上的客户机应用程序可以使用这些模型。
《Python机器学习》的主要意图是让尽可能多的开发人员能够阅读《Python机器学习》。要从《Python机器学习》中得到最大的收获,应该具备一些Python编程的基本知识,以及一些基本的统计知识。就像永远不可能仅通过阅读一《Python机器学习》就学会游泳一样,强烈建议在阅读章节时尝试一下示例代码。继续修改代码,看看输出是如何变化的,你常会对自己能做的工作感到惊讶。
《Python机器学习》中的所有样例代码都可用于Jupyter Notebook。要下载样例代码,可访问《Python机器学习》的支持页面http:www.tupwk.com.cndownpage,然后输入《Python机器学习》ISBN或中文名。另外,也可扫《Python机器学习》封底二维码下载。下载后,可马上试用。
不要拖延了,欢迎阅读《Python机器学习》!
|
|