新書推薦:
《
谁之罪?(汉译世界文学5)
》
售價:HK$
52.8
《
民国词社沤社研究
》
售價:HK$
140.8
《
帕纳索传来的消息(文艺复兴译丛)
》
售價:HK$
108.9
《
DK威士忌大百科
》
售價:HK$
294.8
《
小白学编织
》
售價:HK$
65.8
《
Android游戏开发从入门到精通 第2版 王玉芹
》
售價:HK$
108.9
《
西班牙内战:秩序崩溃与激荡的世界格局:1936-1939
》
售價:HK$
217.8
《
非对称创新:中国企业赶超战略 魏江 刘洋
》
售價:HK$
108.9
|
編輯推薦: |
● 内容详细 覆盖基础知识、工具模块、常用算法及深度学习延伸知识● 案例丰富 16个实战案例+2个项目案例,帮助读者快速提高专业技能● 就业指导 面试题解答+ 自测题+ 简历指导,帮助读者快速入行入职
|
內容簡介: |
本书以零基础讲解为特色,用实例引导读者学习,深入浅出地介绍Python机器学习的相关知识和实战技能。全书共17章,分为5篇。第Ⅰ篇为机器学习入门篇,包含第1章,主要介绍机器学习的概念、机器学习研究的主要任务、如何选择合适的算法及机器学习研究问题的一般步骤等;第Ⅱ篇为工具模块使用篇,包含第2~4章,主要介绍数组计算NumPy、数据分析Pandas、图形展示Matplotlib等;第Ⅲ篇为专业技能提升篇,包含第5~13章,主要介绍算法综述、决策树、朴素贝叶斯、逻辑回归、支持向量机、AdaBoost、线性回归、k-means、PCA等;第Ⅳ篇为深度学习延伸篇,包含第14章,主要介绍卷积神经网络;第Ⅴ篇为项目技能实战篇,包含第15~17章,主要介绍验证码识别、答题卡识别、机器学习简历指导等。同时,本书随书赠送了大量相关的学习资料,以便读者扩展学习。本书适用于任何想学习Python机器学习的读者。无论读者是否从事Python相关工作,是否接触过Python,均可通过学习本书快速掌握Python机器学习的开发方法和技巧。
|
關於作者: |
桑园 副教授、高级工程师,郑州西亚斯学院骨干教师,计算机科学系主任。主要开设课程:Python程序设计、Java?Web框架开发技术、数据库原理、机器学习等。主要研究方向:机器学习算法研究。先后发表论文10余篇,出版教材专著4部,主持省部级教科研项目4项,作为主要完成人参与教学质量工程2项。
|
目錄:
|
第Ⅰ篇 机器学习入门篇第 1 章 机器学习入门之机器学习基础1.1 做第 一个吃螃蟹的人-理解机器学习 0031.2 机器学习研究的主要任务 0051.2.1 监督学习 0051.2.2 非监督学习 0061.3 如何选择合适的算法 0071.4 机器学习研究问题的一般步骤 0071.5 小结 008第Ⅱ篇 工具模块使用篇第 2 章 机器学习模块之数组计算NumPy2.1 从“人机大战”谈NumPy模块的妙用 0112.2 NumPy模块的数组对象 0152.2.1 创建数组对象 0152.2.2 数组对象类型的说明 0192.2.3 随机数生成数组 0202.3 NumPy模块中数组的广播 0222.3.1 数组广播的原则 0232.3.2 数组广播的妙用 0252.4 NumPy模块中数组的操作 0262.4.1 基本的索引 0272.4.2 切片的索引 0292.4.3 布尔型索引 0302.4.4 数组的转置和轴变换 0322.4.5 元素的重复操作:repeat()和tile() 0362.5 通用方法:快速的元素级数组方法 0372.6 利用数组进行运算 0392.6.1 用数学方法进行统计 0392.6.2 数组中布尔值的统计 0422.6.3 将条件逻辑表述为数组运算 0432.6.4 数组的合并和拆分 0452.6.5 数组的排序 0462.6.6 数组的集合运算 0472.7 数组文件的输入和输出 0482.7.1 将数组以二进制的形式读取文件 0482.7.2 存取文本文件 0502.8 小结 050第 3 章 机器学习模块之数据分析Pandas3.1 Pandas数据结构的介绍 0523.1.1 Series数据结构 0523.1.2 Series数据类型的运算 0543.1.3 DataFrame数据结构 0553.1.4 DataFrame数据的修改 0593.1.5 DataFrame中的索引对象 0623.1.6 层次化索引 0633.2 Pandas数据结构中的基本数据操作 0663.2.1 重新索引 0663.2.2 删除指定轴上的项 0703.2.3 算术运算和数据对齐 0713.3 数据处理 0733.3.1 判断缺失数据 0733.3.2 删除缺失数据 0753.3.3 填充缺失数据 0773.3.4 移除重复数据 0793.3.5 替换数据 0813.3.6 排列和随机采样 0823.4 方法的应用与映射 0833.4.1 排序和排名 0843.4.2 带有重复值的轴索引 0873.4.3 汇总和计算描述统计 0883.4.4 相关系数和协方差 0923.5 数据的读取和存储 0933.5.1 读取文本文件格式的数据 0933.5.2 将数据写出到文本格式 0953.6 字符串操作 0953.7 合并数据集 0973.7.1 数据库风格的DataFrame合并 0973.7.2 索引上的合并 1003.7.3 轴向的连接 1013.7.4 分组合并统计 1033.7.5 透视表 1053.8 小结 106第 4 章 机器学习模块之图形展示Matplotlib4.1 Matplotlib绘图入门 1084.1.1 Figure 和subplot 1084.1.2 颜色、标记和线型 1104.1.3 坐标轴标记 1144.1.4 添加图例 1164.1.5 注解 1174.1.6 将图表保存到文件 1184.2 Matplotlib的绘图方法 1194.2.1 线型图 1194.2.2 饼图 1204.2.3 直方图 1214.2.4 条形图 1224.2.5 散点图 1234.3 小结 124第Ⅲ篇 专业技能提升篇第 5 章 机器学习算法之算法综述5.1 从算法巧断小说悬疑情节 1275.2 KNN算法概述 1285.2.1 使用KNN算法分析生活日常事件 1285.2.2 KNN算法的数据准备:使用Python导入数据 1315.2.3 如何测试分类器 1335.3 KNN实战示例:对美颜程度打分 1345.3.1 准备数据:从图像和美颜等级表格中解析数据 1355.3.2 分析数据:使用Matplotlib创建散点图 1365.3.3 测试算法:作为完整程序验证分类器 1375.4 KNN实战示例:手写字识别系统 1395.4.1 准备数据:将图像转换为测试向量 1405.4.2 测试算法:使用KNN算法识别手写数字 1415.5 KNN算法面试题解答 1425.6 KNN算法自测题 1425.7 小结.142第 6 章 机器学习算法之决策树6.1 巧断推理案引入决策树的妙用 1446.2 决策树算法概述 1456.2.1 决策树的构造 1466.2.2 决策树的信息熵 1476.2.3 决策树的信息增益 1486.2.4 主播带货能力分析阐释熵及信息增益计算 1496.3 决策树创建实战示例:公司老板发红包 1536.3.1 公司老板发红包案例说明 1536.3.2 熵值的计算算法实现 1556.3.3 划分数据集算法实现 1566.3.4 递归创建决策树 1576.4 决策树画法实战示例:公司老板发红包 1606.4.1 注解的使用 1606.4.2 构造注解树 1626.5 决策树测试存储实战示例:公司老板发红包 1676.5.1 决策树测试算法 1686.5.2 决策树的存储 1686.6 决策树预测实战示例:预测海选歌手是否入围 1696.6.1 海选歌手入围流程 1696.6.2 准备数据、分析数据 1706.7 决策树的剪枝 1716.7.1 剪枝的概念 1716.7.2 预剪枝 1726.7.3 后剪枝 1736.8 决策树面试题解答 1736.9 决策树自测题 1746.10 小结 174第 7 章 机器学习算法之朴素贝叶斯7.1 解决逃命问题引入朴素贝叶斯 1767.2 对贝叶斯决策的理解 1767.2.1 条件概率解释案例:公司团建 1777.2.2 使用条件概率进行分类 1787.2.3 基于贝叶斯决策理论对分类方法的认识 1797.3 使用朴素贝叶斯进行商品的情感分析 1817.3.1 使用朴素贝叶斯进行商品的情感分析概述 1817.3.2 读取商品评论并切分成文本 1827.3.3 构建词向量 1867.3.4 用词向量计算概率 1867.3.5 对算法的改进 1887.3.6 利用概率值进行分类 1897.3.7 测试算法 1907.4 实战示例:金庸和古龙小说风格判别 1917.4.1 收集数据 1937.4.2 准备数据 1947.4.3 分析数据 1947.4.4 测试算法 1977.5 朴素贝叶斯面试题解答 1987.6 朴素贝叶斯自测题 2007.7 小结 200第 8 章 机器学习算法之逻辑回归8.1 巧析力道学引入逻辑回归 2028.2 逻辑回归概述 2028.2.1 逻辑回归的sigmoid函数 2028.2.2 基于最优化方法的最佳回归系数确定 2048.2.3 梯度上升算法 2058.3 逻辑回归实战示例:鸢尾花分类实现回归 2098.3.1 鸢尾花分类数据集的准备处理 2098.3.2 鸢尾花分类逻辑回归sigmoid函数的实现 2108.3.3 鸢尾花分类逻辑回归梯度上升函数的实现 2108.3.4 鸢尾花分类逻辑回归画出决策边界 2118.3.5 鸢尾花分类逻辑回归梯度上升算法的改进 2138.4 逻辑回归实战示例:商铺扣点方式 2158.4.1 商铺扣点方式的数据读取和处理 2158.4.2 商铺扣点方式的逻辑回归分类实现 2168.4.3 商铺扣点方式的逻辑回归分类算法的测试 2168.5 逻辑回归算法面试题解答 2188.6 逻辑回归算法自测题 2188.7 小结 218第 9 章 机器学习算法之支持向量机9.1 巧分落花引入支持向量机 2209.2 SVM算法概念 2209.2.1 线性可分 2209.2.2 超平面 2229.2.3 SVM 2229.3 SVM算法实战示例:电视台黄金时段节目满意度 2259.3.1 电视台黄金时段节目满意度数据的读取 2259.3.2 选取两个不同Alpha值的辅助函数 2269.3.3 Alpha值不允许超过边界范围的辅助函数 2269.3.4 SMO算法原理的实现 2279.3.5 计算不同的回归系数 2309.3.6 SVM分界线的绘制 2309.4 SVM算法面试题解答 2319.5 SVM算法自测题 2329.6 小结 232第 10章 机器学习算法之AdaBoost10.1 巧析北斗阵法引入AdaBoost 23410.2 AdaBoost算法概述 23410.2.1 AdaBoost算法的具体思想 23410.2.2 AdaBoost的弱分类器是单层决策树 23510.2.3 AdaBoost的数据权重 23710.2.4 AdaBoost的投票表决 23710.2.5 AdaBoost强分类过程 23810.3 AdaBoost算法实现 24510.3.1 决策树数据根据阈值进行分类算法的实现 24610.3.2 单层决策树算法的实现 24610.3.3 AdaBoost算法的实现 24710.4 AdaBoost算法实战示例:商品购买预测 24910.4.1 商品购买预测的数据读取实现 24910.4.2 商品购买预测的测试函数实现 25010.4.3 商品购买预测的程序整合 25110.5 AdaBoost算法面试题解答 25210.6 AdaBoost算法自测题 25210.7 小结 252第 11章 机器学习算法之线性回归11.1 解决论剑问题引入线性回归 25411.2 线性回归算法概述 25411.2.1 线性回归模型 25511.2.2 线性回归的最小二乘法 25611.3 线性回归实战示例:钓鱼久坐与鱼重量关系 25811.3.1 钓鱼久坐与鱼重量关系研究的数据读取 25811.3.2 钓鱼久坐与鱼重量关系研究的最佳拟合直线 25811.3.3 钓鱼久坐与鱼重量关系研究的最佳拟合直线的绘制 25911.4 线性回归中的过拟合和欠拟合 26011.4.1 线性回归中的过拟合 26011.4.2 线性回归中的欠拟合 26111.5 局部加权线性回归 26111.5.1 局部加权线性回归的解释 26111.5.2 局部加权线性回归的代码实现 26211.5.3 局部加权线性回归的测试 26311.6 线性回归实战示例:结合年龄和BMI拟合减肥花销 26311.6.1 结合年龄和BMI拟合减肥花销的数据读取 26311.6.2 结合年龄和BMI拟合减肥花销直线的函数实现 26411.7 线性回归提高:岭回归和套索回归 26511.7.1 岭回归 26511.7.2 套索回归 26711.8 岭回归实战示例:分析抖音视频点击率和收藏 26711.8.1 岭回归分析抖音视频点击率和收藏的数据读取 26711.8.2 岭回归算法逻辑的实现 26811.8.3 岭回归算法系数的测试 26811.8.4 不同λ值的岭回归算法的最佳拟合直线 26911.9 线性回归算法面试题解答 27011.10 线性回归算法自测题 27011.11 小结 270第 12章 机器学习算法之k-means12.1 “巧施反间计”引入k-means聚类 27212.2 k-means算法概述 27212.3 k-means幼儿园亲子活动 27712.3.1 收集数据 27812.3.2 准备数据 27812.3.3 分析数据 27812.3.4 实现算法 27812.3.5 画出k-means算法的结果图 28012.4 图像分割技术实现聚类 28212.4.1 准备数据 28212.4.2 距离计算 28312.4.3 第 一次随机质心的计算 28312.4.4 k-means算法的改进 28412.4.5 k-means图像分割的显示 28512.5 图像分割算法的改进 28612.5.1 k-means图像分割的显示 28612.5.2 像素距离的改进 28612.5.3 第 一次随机质心的计算 28612.5.4 k-means算法的改进 28712.5.5 k-means图像分割的显示 28712.6 k-means算法面试题解答 28812.7 k-means算法自测题 28912.8 小结 289第 13章 机器学习算法之PCA13.1 巧拼十八掌法引入PCA聚类 29113.2 聚类的概念和分类 29113.2.1 聚类的概念 29113.2.2 分层凝聚聚类方法 29213.2.3 PCA聚类方法 29213.3 PCA聚类方法的求解步骤 29513.3.1 协方差矩阵 29613.3.2 奇异值求解29613.4 PCA实战示例:使用PCA实现菜品制作调料配比 29813.4.1 准备数据:菜品制作调料配比表数据的读取 29913.4.2 PCA算法:菜品制作调料配比表PCA降维 30013.4.3 表征数据:菜品制作调料配比降维结果图示 30013.5 PCA实战示例:使用PCA分析图像压缩技术 30113.5.1 图像读取:Pillow模块读取图像 30213.5.2 图像压缩:PCA算法实现图像压缩 30213.5.3 错误率计算:图像压缩错误率的计算 30413.6 PCA算法面试题解答 30413.7 PCA算法自测题 30513.8 小结 305第Ⅳ篇 深度学习延伸篇第 14章 深度学习延伸之卷积神经网络14.1 认识神经网络 30814.1.1 神经元 30814.1.2 激活函数 31014.2 认识卷积神经网络 31214.2.1 卷积层 31314.2.2 一维卷积过程 31614.2.3 卷积神经网络输入层前向传播到卷积层 32214.2.4 池化层 32314.2.5 全连接层 32414.3 Keras框架实现卷积神经网络 32414.3.1 Keras模块介绍 32414.3.2 Keras框架的安装 32514.3.3 Keras框架数据集的准备 32514.3.4 Keras实现CNN卷积神经网络 32614.4 小结 333第Ⅴ篇 项目技能实战篇第 15章 机器学习实战之验证码识别15.1 验证码识别 33615.2 图像处理的灰度化、二值化 33715.2.1 像素点 33715.2.2 图像灰度化 34015.2.3 图像二值化 34215.3 图像分割 34315.3.1 按区域划分的图像分割技术 34315.3.2 按边缘划分的图像分割技术 34515.3.3 图像分割技术的进阶 34715.4 KNN算法测试验证码 35115.4.1 Sklearn包的介绍 35115.4.2 KNN算法测试验证码 35215.5 小结 354第 16章 机器学习实战之答题卡识别16.1 答题卡识别 35616.2 OpenCV 35616.2.1 OpenCV介绍 35616.2.2 安装和使用OpenCV 35716.2.3 OpenCV存取图像 35716.2.4 OpenCV图像灰度化 35916.2.5 OpenCV图像二值化 36016.2.6 OpenCV边缘检测 36716.3 OpenCV形态学中腐蚀与膨胀 37616.3.1 形态学中的膨胀 37716.3.2 形态学中的腐蚀 38116.3.3 腐蚀和膨胀的应用 38516.4 OpenCV轮廓findContours和drawContours 38616.5 OpenCV霍夫直线检测 38816.6 答题卡识别 39116.7 小结 396第 17章 简历分享就业之机器学习简历指导17.1 机器学习简历中应提及的技能 39817.2 机器学习简历中项目的描述 39817.3 机器学习简历分享 39817.4 小结 400
|
|