新書推薦:
《
家、金钱和孩子
》
售價:HK$
64.9
《
形而上学与测量
》
售價:HK$
74.8
《
世界航母、舰载机图鉴 【日】坂本明
》
售價:HK$
74.8
《
量价关系——透视股票涨跌脉络
》
售價:HK$
74.8
《
创伤与记忆:身体体验疗法如何重塑创伤记忆 [美]彼得·莱文
》
售價:HK$
64.9
《
复原力
》
售價:HK$
75.9
《
近代中国思维方式的演变(王中江著作系列)
》
售價:HK$
209.0
《
我可以近乎孤独地度过一生
》
售價:HK$
96.8
|
編輯推薦: |
通过14个轻松有趣的专题讲座,帮助初学者掌握机器学习的相关概念,帮助面试者快速梳理和回顾机器学习知识。
|
內容簡介: |
本书从传统的机器学习,如线性回归、逻辑回归、朴素贝叶斯、支持向量机、集成学习,到前沿的深度学习和神经网络,如DNN、CNN、BERT、ResNet等,对人工智能技术进行零基础讲解,内容涵盖数学原理、公式推导、图表展示、企业应用案例。本书面向初中级读者,能帮助读者迅速掌握机器学习技术的相关概念及原理。本书内容结合作者多年的科研工作经验,理论和实践并重,对科研、学习、面试等均有帮助。
|
關於作者: |
2003年~2012年年就读于北京科技大学本科硕士博士,2016年于北京大学博士后流动站出站,研究方向为:机器学习,人工智能,计算机视觉和自然语言属于。工作于腾讯,爱奇艺等顶级互联网公司从事人工智能技术的应用研发工作。曾获得腾讯年度人工智能铜奖,所做项目涉及自然语言处理,推荐系统,领导团队参与多项公司级项目的搭建和优化。工作之余,一直和培训机构进行合作,主讲人工智能课程,致力于人工智能在中国的普及推广和应用。
|
目錄:
|
第1章 数据的量化和特征提取 1
1.1 机器学习概述 1
1.2 特征提取 2
1.3 向量距离计算 6
第2章 线性回归 12
2.1 线性回归的基本概念 13
2.2 损失函数和梯度下降法 14
2.3 训练集和测试集 19
2.4 多项式回归 21
2.5 线性回归的高级技巧 23
2.5.1 特征敏感性研究 23
2.5.2 损失函数的选择 24
第3章 逻辑回归 27
3.1 逻辑回归的基本原理 28
3.2 交叉熵和KL距离 32
3.2.1 KL距离 32
3.2.2 梯度下降法 34
3.2.3 上采样和下采样 36
3.3 线性不可分及其解决方案 38
3.4 L1正则和L2正则 39
3.5 分类模型的评价标准 43
3.6 逻辑回归的特征提升技巧 47
3.6.1 特征归一化 47
3.6.2 特征分段 49
3.7 深入理解损失函数和逻辑函数 51
第4章 因子分解模型 55
4.1 基本原理和特征交叉 55
4.1.1 基本原理 55
4.1.2 特征交叉简化 58
4.1.3 参数学习 59
4.2 因子分解模型和矩阵分解 61
第5章 经典分类模型 63
5.1 支持向量机 63
5.1.1 支持向量机的基本原理 63
5.1.2 支持向量机和逻辑回归的比较 68
5.2 核方法 70
5.2.1 核函数 70
5.2.2 核函数在支持向量机中的应用 72
5.3 朴素贝叶斯 73
5.3.1 朴素贝叶斯原理 73
5.3.2 朴素贝叶斯的参数估计 76
5.4 维数灾难 78
5.5 奥卡姆剃刀定律的应用 82
5.6 经验风险、期望风险和结构风险 83
第6章 无监督学习 85
6.1 K-Means聚类 86
6.1.1 K-Means算法的基本原理 86
6.1.2 改进型K-Means算法 88
6.1.3 K-Means算法和逻辑回归的结合应用 91
6.2 主题模型 92
6.2.1 LDA模型的原理 93
6.2.2 LDA模型的训练 95
第7章 集成学习 100
7.1 决策树 100
7.2 随机森林 105
7.3 GBDT 108
第8章 深度神经网络 113
8.1 BP神经网络的基本原理 113
8.2 多分类与Softmax函数 118
8.3 梯度下降法和链式法则 120
8.4 度量学习 125
第9章 神经网络调优 130
9.1 激活函数选型 131
9.2 权重初始化 135
9.3 改进型梯度下降法 137
9.3.1 随机梯度下降法 138
9.3.2 鞍点问题 141
9.3.3 梯度下降法的优化 142
9.4 过拟合解决方案 145
9.4.1 正则化 145
9.4.2 Dropout 146
9.4.3 提前终止 147
9.4.4 批标准化和层标准化 148
9.4.5 Shortcut 151
9.4.6 标签平滑 151
9.4.7 人工制造数据 152
第10章 自然语言处理 154
10.1 自然语言处理模型 154
10.2 one-hot编码和embedding技术 156
10.3 哈夫曼树和负采样 161
10.3.1 哈夫曼树 161
10.3.2 负采样 163
10.4 Word2vec的应用 165
10.5 fastText模型的原理及应用 166
第11章 卷积神经网络 169
11.1 卷积层和池化层 169
11.2 卷积神经网络在图像处理中的应用 177
11.3 卷积神经网络中的批标准化 179
11.4 TextCNN的原理及应用 180
第12章 深入卷积层 185
12.1 1 ×; 1卷积 185
12.2 小尺寸卷积 186
12.3 宽度卷积和Inception 187
12.4 Depthwise卷积和Pointwise卷积 189
12.5 特征通道加权卷积 193
第13章 循环神经网络和LSTM模型 196
13.1 循环神经网络模型详解 196
13.1.1 循环神经网络的基本原理 196
13.1.2 循环神经网络存在的一些问题 199
13.2 LSTM模型详解 202
13.3 LSTM模型的改进和应用 206
13.4 CTC算法 208
第14章 Attention模型和Transformer模型 210
14.1 Attention模型详解 210
14.1.1 注意力机制的基本原理 210
14.1.2 Attention模型概述 212
14.1.3 Attention模型的改进形式 214
14.1.4 Self-Attention模型 215
14.1.5 Multi-Head Attention模型 217
14.2 Transformer模型原理 219
14.3 BERT模型及应用 221
|
內容試閱:
|
序
机器学习是人工智能领域最活跃的分支之一,作为多学科交叉的重要工具,为计算机领域解决实际学习问题提供了理论支撑与应用算法。近年来,机器学习在互联网应用中崭露头角,计算机视觉、自然语言处理、推荐系统、搜索系统等积累了大量的数据和丰富的场景,促进了包括机器学习在内的诸学科的发展与繁荣。与此同时,机器学习的快速发展,也让我们切实领略了人工智能给人类生活带来各种改变的潜力。
这是一本涵盖机器学习现有重要领域和关键算法的读物,主要面向人工智能、机器学习、模式识别、数据挖掘、计算机应用、数学和统计学等领域的研究生和相关技术人员。这本书为我们介绍了经典机器学习、深度学习的常见模型,涉及领域包括图像处理、自然语言处理、推荐系统等。
不同于侧重理论的机器学习读物,本书作者摒弃了复杂烦琐的数学公式和理论推导,转而采用对各类知识点给出应用实例和绘制图表等方式进行讲解。同时,书中蕴含了作者对机器学习理论及各类模型的内在关系的理解与思考,并通过细致的对比和说明,透彻地讲述了不同概念之间的传承与发展,使读者可以快速领略机器学习的精髓并掌握一定的自学能力。
本书作者勤于思考、关注技术发展,在工作中积累了丰富的机器学习实战经验,这些经验正是本书的灵感和和创意来源。难能可贵的是,书中的大量示例均源于作者亲身参与的项目,对读者具有借鉴意义,这也是本书的亮点之一。特此推荐。
中国科学院院士 樊文飞
前言
近十年移动互联网的蓬勃发展,催生出了无数优秀的企业和现象级的产品,这些产品拥有庞大的用户群,且每时每刻都在产生海量的数据。随着数据的积累,人们开始思考如何从这些数据中获得更好的产品服务、实现更高的商业价值。
机器学习作为一项新兴技术,可以对文本、图像、语音、行为等数据进行分析,探寻数据背后的规律,并根据这些规律对未来进行预测。不少新兴公司将机器学习技术与海量的数据结合起来,开发出大量的新产品(例如短视频推荐、图片美化、在线教育等),并取得了巨大的成功。毫不夸张地说,这些成功只是机器学习舞台的序章,未来会有更加丰富的场景等待被机器学习赋能。
本书内容
与其他计算机技术相比,机器学习涉及的数学知识,特别是微积分和统计学知识比较多,并且有一定的入行门槛,对初入此领域的人来说不是那么友好。而国内现阶段的一些相关书籍,要么过于学术化、语言深奥、包含大量数学公式,让人望而却步,要么是编程技术手册,缺少对原理的讲解和对技术的深入分析。虽然互联网上有不少学习资料,但过于零散、系统性不足,不利于初学者建立知识体系。基于此现状,笔者萌生了写一本面向初学者的机器学习图书的想法,经过近两年的努力,终于完成了这项并不轻松的“工程”。
本书有以下特色:面向初学者,语言通俗易懂,没有过于学术化的表述;对各类机器学习技术背后的原理进行了深入的分析,同时涉及很多相关岗位的面试要点,可作为面试参考书阅读;结合笔者在实际工作中遇到的问题,讨论了很多可落地的和具有实用性的技术创新思路,涉及的知识点可以给读者的工作带来启发。
鉴于笔者的精力和能力有限,书中难免会有纰漏,望同行和读者指正。
读者服务
如果您在阅读本书的过程中有任何疑问,都可以发送电子邮件至lu_0819@163.com,与笔者共同探讨。
您可以访问B站“皮蛋爸爸卢菁”的个人空间,观看人工智能技术相关视频。
您也可以扫描本书封底的二维码并发送“40890”,关注博文视点微信客服号,获取更多人工智能图书信息及相关资源等。
卢 菁
2021年3月
|
|