新書推薦:
《
学术的中心:英法德美
》
售價:HK$
87.4
《
为什么要读人类学
》
售價:HK$
77.3
《
井邑无衣冠 : 地方视野下的唐代精英与社会
》
售價:HK$
95.2
《
星地融合移动通信系统与关键技术从5G NTN到6G的卫星互联网发展
》
售價:HK$
212.6
《
妈妈,你好吗?(一封写给妈妈的“控诉”信,日本绘本奖作品)
》
售價:HK$
42.6
《
保守主义:为传统而战
》
售價:HK$
154.6
《
不同境遇的36岁:无尽与有限+人生半熟
》
售價:HK$
112.0
《
小时光 油画棒慢绘零基础教程
》
售價:HK$
88.5
|
編輯推薦: |
当今组织创建的分析和机器学习(ML)模型超过一半从未投入生产。机器学习运营化的一些挑战和障碍是技术性的,但其他则是组织性的。无论采取哪种方式解决问题,底线是未投入生产的模型不会影响业务。本书介绍了MLOps的关键概念,以帮助数据科学家和应用工程师操作ML模型来驱动真正的业务变化,并随着时间的推移维护和改进这些模型。以全球众多MLOps应用课程为基础,9位机器学习专家深入探讨了模型生命周期的五个阶段——开发、预生产、部署、监控和治理,揭示了如何将强大的MLOps流程贯穿始终。本书将帮助你:·通过减少整个ML管道和工作流程中的摩擦,实现数据科学的价值。·通过再培训、定期调整和全面改造来完善ML模型,以确保长期准确性。·设计MLOps生命周期,使用公正、公平、可解释的模型将组织风险降至*低。·为管道的部署和更复杂、标准化程度更低的外部业务系统实施ML模型。
|
內容簡介: |
本书分为三部分。第1部分介绍MLOps主题,深入探讨了它是如何(以及为什么)发展成一门学科的、需要谁参与才能成功执行MLOps以及需要哪些组成部分。第二部分介绍了机器学习模型的生命周期,其中包括有关模型开发、生产准备、生产部署、监测和治理的章节。这些章节不仅包括一般的注意事项,还包括MLOps生命周期每个阶段的注意事项,并提供第3章中所涉及主题相关的更多详细信息。第三部分提供了MLOps的具体示例,以便读者了解MLOps在实践中的设置和含义。
|
目錄:
|
前言1第一部分 MLOps是什么,为什么要使用MLOps5第1章 为什么现在要使用MLOps,使用MLOps面临的挑战71.1 定义MLOps及面临的挑战81.2 使用MLOps以降低风险111.3 大规模的MLOps14结语15第2章 MLOps的使用人员162.1 行业专家172.2 数据科学家202.3 数据工程师222.4 软件工程师232.5 DevOps团队232.6 模型风险管理者/审计师242.7 机器学习架构师25结语26第3章 MLOps的主要组成部分273.1 机器学习入门273.2 模型开发283.3 产品化与部署313.4 监控333.5 迭代与生命周期363.6 治理38结语42第二部分 如何实现43第4章 开发模型454.1 什么是机器学习模型464.2 数据探索504.3 特征工程与特征选择504.4 实验534.5 评估和比较模型554.6 版本管理和再现性60结语62第5章 准备投入生产635.1 运行时环境635.2 模型风险评估675.3 机器学习的质量保证695.4 测试的关键注意事项695.5 再现性和可审计性705.6 机器学习安全725.7 降低模型风险74结语76第6章 部署到生产786.1 CI/CD管道786.2 创建ML工件806.3 部署策略826.4 容器化856.5 扩展部署866.6 需求和挑战88结语89第7章 监控和反馈回路907.1 模型应该多久接受一次再训练917.2 理解模型退化947.3 实践中的漂移检测977.4 反馈回路100结语108第8章 模型治理1098.1 由谁决定组织的治理需求1098.2 将治理与风险级别相匹配1118.3 推动MLOps治理的现行法规1128.4 新一轮人工智能特定法规1158.5 负责任的人工智能的出现1178.6 负责任的人工智能的关键要素1188.7 MLOps治理模板122结语130第三部分 MLOps具体示例131第9章 实践中的MLOps:消费信贷风险管理1339.1 背景:商业使用案例1339.2 模型开发1349.3 模型偏见考虑1359.4 为生产做准备1359.5 部署到生产环境136结语137第10章 实践中的MLOps:营销推荐引擎13810.1 推荐引擎的兴起13810.2 数据准备14010.3 设计和管理实验14110.4 模型训练和部署14110.5 管道结构和部署策略14410.6 监控和反馈145结语148第11章 实践中的MLOps:消耗预测14911.1 能源系统14911.2 数据收集15111.3 问题定义:机器学习,还是不机器学习15311.4 空间和时间分辨率15311.5 实施15411.6 建模15511.7 部署15711.8 监控157结语158
|
內容試閱:
|
在机器学习(ML)的发展历史中,我们已经到达了一个转折点,该技术已经从理论和学术领域进入了“现实世界”—为全世界的人提供各种服务和产品的业务。虽然这种转变令人兴奋,但同时也充满挑战,因为这将机器学习模型的复杂性与现代企业的复杂性结合在一起。随着各种企业从尝试机器学习到在生产环境中扩展机器学习,其中的困难之一便是维护。企业如何从仅管理单个模型转变为管理几十乃至成百上千个模型呢?这不仅仅是MLOps发挥作用的地方,也是体现上述技术和商业方面复杂性的地方。本书将向读者介绍当前使用MLOps面临的挑战,同时还为开发MLOps功能提供实用的见解和解决方案。本书适用人群我们专门为分析人员和IT运营团队经理(即直接面对在生产中扩展机器学习任务的人员)编写了这本书。鉴于MLOps是一个新领域,我们编写了本书,作为创建一个成功的MLOps环境的指南,涵盖了从组织到技术方面的挑战。本书结构本书分为三个部分。第一部分(第1~3章)是对MLOps主题的介绍,深入探讨它如何(以及为何)发展成一门学科、需要谁参与才能成功执行MLOps以及需要哪些组成部分。第二部分(第4~8章)大致介绍了机器学习模型的生命周期,其中包括有关模型开发、生产准备、生产部署、监控和治理的章节。这些章节不仅包括一般的注意事项,还包括MLOps生命周期每个阶段的注意事项,并提供与第3章中所涉及主题相关的更多详细信息。最后一部分(第9~11章)提供了MLOps在当今公司中的具体示例,以便读者了解MLOps在实践中的设置和含义。尽管公司名称是虚构的,但这些故事是以现实中的公司在MLOps和大规模模型管理方面的经验为基础的。排版约定本书中使用以下排版约定:斜体(Italic) 表示新的术语、URL、电子邮件地址、文件名和文件扩展名。等宽字体(Constant width) 用于程序清单,以及段落中的程序元素,例如变量名、函数名、数据库、 数据类型、环境变量、语句以及关键字。等宽粗体(Constant width bold) 表示应由用户直接输入的命令或其他文本。等宽斜体(Constant width italic) 表示应由用户提供的值或由上下文确定的值替换的文本。O’Reilly在线学习平台(O’Reilly Online Learning)40多年来,O’Reilly Media致力于提供技术和商业培训、知识和卓越见解,来帮助众多公司取得成功。我们拥有独一无二的专家和革新者组成的庞大网络,他们通过图书、文章、会议和我们的在线学习平台分享他们的知识和经验。O’Reilly的在线学习平台允许你按需访问现场培训课程、深入的学习路径、交互式编程环境,以及O’Reilly和200多家其他出版商提供的大量文本和视频资源。有关的更多信息,请访问http://oreilly.com。如何联系我们对于本书,如果有任何意见或疑问,请按照以下地址联系本书出版商。美国:O’Reilly Media,Inc.1005 Gravenstein Highway NorthSebastopol,CA 95472中国:北京市西城区西直门南大街2号成铭大厦C座807室(100035)奥莱利技术咨询(北京)有限公司要询问技术问题或对本书提出建议,请发送电子邮件至errata@oreilly.com.cn。本书配套网站https://oreil.ly/intro-mlops上列出了勘误表、示例以及其他信息。关于书籍、课程、会议和新闻的更多信息,请访问我们的网站http://www.oreilly.com。我们在Facebook上的地址:http://facebook.com/oreilly我们在Twitter上的地址:http://twitter.com/oreillymedia我们在YouTube上的地址:http://youtube.com/oreillymedia致谢我们要感谢整个Dataiku团队,感谢他们从构思到完成对本书出版的支持。这是真正的团队努力,就像我们在Dataiku做的大多数事情一样,植根于无数人和团队之间的基本合作。感谢那些从一开始就与O’Reilly一起支持我们的愿景的人、那些帮助我们写作和编辑的人、那些提供诚实反馈的人(即使这意味着更多的写作、重写、再重写)、那些在内部当啦啦队队员的人,当然,还有那些帮助我们将本书推向世界的人。
|
|