新書推薦:
《
三神之战:罗马,波斯与阿拉伯帝国的崛起
》
售價:HK$
80.6
《
法国通史(全六卷)
》
售價:HK$
985.6
《
慢慢变富66招
》
售價:HK$
53.8
《
战国竹书复原综论
》
售價:HK$
98.6
《
走出内心的深渊:快节奏人群心理疾病与健康指南(原书第3版)
》
售價:HK$
77.3
《
如何成为一家千亿公司
》
售價:HK$
76.2
《
趋势跟踪: 汤姆·巴索的交易谋略
》
售價:HK$
77.3
《
滚滚红尘(《滚滚红尘》电影原著)
》
售價:HK$
54.9
|
編輯推薦: |
如果正在构建用于小规模使用的机器学习模型,那么本书不太适合你。但是,如果你是开发人员,正在构建需要快速响应的、可靠的且具有良好用户体验的产品级ML应用程序,那么本书再适合不过。本书涵盖机器学习系统的原理和实践,这些原理和实践非常容易运行和维护,而且对用户来说具有良好的可靠性。
《机器学习系统》教你设计和实现可用于产品的ML系统。在使用Spark构建管道、使用Akka创建高度可伸缩的服务,以及在大量数据集上使用强大的机器学习库如MLib时,你将学习反应式设计的原则。这些例子是使用Scala语言编写的,但是同样的思想和工具在Java中也适用。
|
內容簡介: |
主要内容
使用Spark、MLlib和Akka
反应式设计模式
监控和维护大型系统
特征、actor和监督
读者需要具备Java或Scala中级技能,但不需要有机器学习经验。
|
關於作者: |
Jeff Smith构建了强大的机器学习系统。在过去十年中,他一直致力于构建数据科学应用程序、团队和公司,使其成为位于纽约、旧金山和中国香港的各个团队的一部分。
|
目錄:
|
目录
第Ⅰ部分 反应式机器学习基础知识
第1章 学习反应式机器学习3
1.1 机器学习系统的一个示例4
1.1.1 构建原型系统4
1.1.2 建立更好的系统6
1.2 反应式机器学习7
1.2.1 机器学习7
1.2.2 反应式系统12
1.2.3 使机器学习系统具有反应性15
1.2.5 何时不使用反应式机器学习19
1.3 本章小结19
第2章 使用反应式工具21
2.1 Scala,一种反应式语言22
2.1.1 对Scala中的不确定性做出反应23
2.1.2 时间的不确定性24
2.2 Akka,一个反应式工具包27
2.2.1 actor模型27
2.2.2 使用Akka确保回弹性29
2.3 Spark,一个反应式的大数据框架32
2.4 本章小结37
第Ⅱ部分 构建反应式机器学习系统
第3章 收集数据41
3.1 感知不确定数据42
3.2 收集大规模数据45
3.2.1 维护分布式系统中的状态45
3.2.2 了解数据收集50
3.3 持久化数据50
3.3.1 弹性和回弹性数据库51
3.3.2 事实数据库52
3.3.3 查询持久化事实54
3.3.4 了解分布式事实数据库59
3.4 应用63
3.5 反应性64
3.6 本章小结64
第4章 生成特征67
4.1 Spark ML68
4.2 提取特征69
4.3 转换特征72
4.3.1 共同特征转换74
4.3.2 转换概念76
4.4 选择特征77
4.5 构造特征代码79
4.5.1 特征生成器79
4.5.2 特征集的组成83
4.6 应用86
4.7 反应性87
4.8 本章小结88
第5章 学习模型89
5.1 实现学习算法90
5.1.1 贝叶斯建模92
5.1.2 实现朴素贝叶斯94
5.2 使用MLlib98
5.2.1 构建ML管道99
5.2.2 演化建模技术103
5.3 构建外观模式105
5.4 反应性111
5.5 本章小结112
第6章 评估模型113
6.1 检测欺诈114
6.2 测试数据115
6.3 模型度量118
6.4 测试模型123
6.5 数据泄漏125
6.6 记录起源126
6.7 反应性128
6.8 本章小结128
第7章 发布模型129
7.1 农业的不确定性130
7.2 持久化模型130
7.3 服务模型135
7.3.1 微服务135
7.3.2 Akka HTTP136
7.4 容器化应用138
7.5 反应性141
7.6 本章小结142
第8章 响应143
8.1 以海龟的速度移动144
8.2 用任务构建服务144
8.3 预测交通146
8.4 处理失败151
8.5 构建响应系统155
8.6 反应性156
8.7 本章小结157
第Ⅲ部分 操作机器学习系统
第9章 交付161
9.1 运送水果161
9.2 构建和打包162
9.3 构建管道164
9.4 评估模型165
9.5 部署165
9.6 反应性168
9.7 本章小结168
第10章 演化智能169
10.1 聊天169
10.2 人工智能170
10.3 反射代理171
10.4 智能代理172
10.5 学习代理174
10.6 反应式学习代理177
10.6.1 反应原则177
10.6.2 反应策略178
10.6.3 反应式机器学习178
10.7 反应性178
10.7.1 库179
10.7.2 系统数据179
10.8 反应性探索181
10.8.1 用户182
10.8.2 系统维度182
10.8.3 应用反应原则183
10.9 本章小结184
附录185
|
內容試閱:
|
前言
我的整个职业生涯都在处理数据。根据兴趣,随着职业生涯的发展,我一直致力于研究越来越复杂的系统,并将重点放在机器学习和人工智能系统上。
当我的工作内容从更传统的数据仓库类型的任务发展到构建机器学习系统时,我被一种奇怪的缺失所震惊。当我主要使用数据库时,可以依赖丰富的学术和专业文献,了解如何构建与它们交互的数据库和应用程序,以帮助定义良好的设计。所以,让我感到困惑和惊讶的是,机器学习作为一个领域通常缺乏这种指导。除了模型学习算法外,没有任何规范的实现。需要建立的系统中有很大一部分在文献中被掩盖了。通常,我甚至无法为给定的系统组件找到一致的名称,因此我和我的同事们不可避免地会在术语选择上相互混淆。我想要的是一个框架,类似于机器学习的Ruby on Rails,但似乎没有这样的框架 。除了一个普遍接受的框架,我至少想要一些明确的设计模式来构建机器学习系统,但遗憾的是,当时还没有用于机器学习系统的设计模式。
因此,我用一种艰难的方式建立了机器学习系统:尝试一些东西,然后找出那些不起作用的地方。当我需要发明术语时,只选择那些感觉合理的术语。随着时间的推移,我尝试整合了一些对机器学习系统有用的内容和没有连贯成整体的内容。像分布式系统和函数式编程这样的领域,有望为我对机器学习系统的看法提供更好的支撑,但它们没有特别关注机器学习的应用。
然后,我通过阅读Reactive Manifestowww.reactivemani- festo.org发现了反应式系统设计。它的简单的一致性和大胆的使命让人颇感惊讶。这是构建现代软件所面临挑战的完整世界观,以及构建满足该挑战的软件的原则性方法。我对这种方法的前景感到很兴奋,并立即开始尝试应用于我在设计和构建机器学习系统时遇到的问题。
我试图想象如何使用反应式系统设计中的工具,将一个简单的机器学习系统重构得更好。为此,我写了一篇关于预测初创公司的博客文章http:mng.bz9YK8。
这个帖子出人意料地得到广泛而严肃的回应。我从回应中学到了两件事:
● 我不是唯一有兴趣提出建立机器学习系统的原则方法的人。
● 人们真的很喜欢用卡通动物来谈论机器学习。
这些见解促使我写了这本你目前正在阅读的书。在《机器学习系统》中,我试图涵盖你在构建现实世界的机器学习系统时可能遇到的一系列问题,这些系统必须要让客户满意。我的重点是介绍你在其他书籍中找不到的所有内容。我试图让《机器学习系统》尽可能宽泛,希望能够涵盖现代数据科学家或工程师的全部职责。我将探讨如何使用一般原则和技术来分解机器学习系统中给定组件的一些看似独特的问题。我的目标是尽可能全面地涵盖机器学习系统组件,但这意味着我无法全面地研究模型学习算法和分布式系统等大型主题。相反,我设计了一些示例,为你提供构建机器学习系统的各种组件的经验。
我坚信,要构建一个真正强大的机器学习系统,必须从系统级的角度看待这个问题。在《机器学习系统》中,我将提供一个高级的视角,帮助你围绕该系统中的每个关键组件构建技能。根据我作为技术主管和经理的经验,我知道整个机器学习系统及其组件的组合是机器学习系统开发人员应该拥有的最重要技能之一。因此,《机器学习系统》试图涵盖构建强大的、面向现实世界的机器学习系统需要的所有不同部分。在整个过程中,我们将从团队的角度出发,为现实用户提供先进的机器学习系统。因此,我们将探索如何在机器学习系统中构建所有内容。这是项庞大的工作,我很高兴你有兴趣参与其中。
|
|