登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書

『簡體書』工业大数据分析算法实战

書城自編碼: 3793578
分類:簡體書→大陸圖書→計算機/網絡人工智能
作者: 田春华
國際書號(ISBN): 9787111709619
出版社: 机械工业出版社
出版日期: 2022-09-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 181.7

我要買

share:

** 我創建的書架 **
未登入.


新書推薦:
送你一匹马(“我不求深刻,只求简单。”看三毛如何拒绝内耗,为自己而活)
《 送你一匹马(“我不求深刻,只求简单。”看三毛如何拒绝内耗,为自己而活) 》

售價:HK$ 64.9
秦汉史讲义
《 秦汉史讲义 》

售價:HK$ 151.8
万千心理·我的精神分析之道:复杂的俄狄浦斯及其他议题
《 万千心理·我的精神分析之道:复杂的俄狄浦斯及其他议题 》

售價:HK$ 104.5
荷马:伊利亚特(英文)-西方人文经典影印21
《 荷马:伊利亚特(英文)-西方人文经典影印21 》

售價:HK$ 107.8
我的心理医生是只猫
《 我的心理医生是只猫 》

售價:HK$ 49.5
巴拉吉预言
《 巴拉吉预言 》

售價:HK$ 74.8
股权控制战略:如何实现公司控制和有效激励(第2版)
《 股权控制战略:如何实现公司控制和有效激励(第2版) 》

售價:HK$ 98.8
汉译名著·哲学经典十种
《 汉译名著·哲学经典十种 》

售價:HK$ 761.2

 

建議一齊購買:

+

HK$ 90.9
《跟世界冠军一起玩VEX IQ机器人》
+

HK$ 99.8
《新一代物联网架构技术 分层算力网络》
+

HK$ 66.7
《测算与判断:人工智能的终极未来》
+

HK$ 123.8
《机器学习与R语言(原书第3版)》
+

HK$ 58.8
《名师讲科技前沿系列--图解芯片技术》
+

HK$ 108.6
《深度学习与目标检测:工具、原理与算法》
編輯推薦:
所谓“工业大数据分析”,其实就是在工业生产过程、工业设备、流水线等一系列复杂系统中,通过通过分析现象去看本质的过程。比如设备出了问题,像是风电涡轮不转了,流水线卡住了,机器堵了,生产的产品突然出现了好多残次品,曾经的工程师都是凭经验,或者观察,通过现象去看本质。而现在,因为现代化的工厂或者工业设备的每一个环节都有各种电子数据的记录,而数据分析师则可以通过这些数据的统计,通过合适的算法和模式,去通过计算机发现这些设备出现的故障和问题。这就是数字化时代的故障分析技术——数据挺多,但是怎么用才对,这是一个数据分析师个人技术实力的体现。现在太多的数据分析师,只停留在“看”数据,而不是“分析”数据的水平上——知道从哪入手去分析,比分析计算本身更重要。而这本书就是教你“从哪开始分析,怎么站在机器的角度去分析机器的数据”。作者是工业大数据分析领域的首席科学家,20多年一直从事数据分析,很多大型机器设备的疑难杂症在他手里迎刃而解,作者语言简练,字字珠玑,对每个算法都给出了自己*直白的解释,这些干货却积攒了70万字! 从事工业领域的技术人员,都应该读一读田博士的这本著作。
內容簡介:
《工业大数据分析算法实践》以工业大数据的特点和需求为牵引,阐述了工业大数据分析的算法与实现机制,使具有工科背景读者建立起数据思维,灵活利用数据分析算法进行实际问题的建模,并实现分析项目高效迭代与落地。具体主题覆盖了工业大数据分析工程思维和软件栈,工业数据的数据探索,预处理方法和常用机器学习算法,故障诊断、质量优化、流程优化的分析算法,专家规则驱动方法,以及工业数据分析工程等内容。
《工业大数据分析算法实践》分10章,可划分为四个部分。第一部分(第1章)是数据分析概览,目的是建立起数据分析算法的概念框架,并给出学习路线。第2~5章是第二部分,侧重在通用数据分析算法,包括数据预处理、机器学习、时序挖掘算法和*优化等其他算法。第三部分包括第6~8章,讨论了工业分析的算法思路,覆盖了生产质量分析(PQM)、生产效率优化(PEM)等典型分析课题的算法组合套路。第四部分侧重在分析工程方法,第9章讨论了工业专家知识沉淀方法,第10章讨论了数据分析的软件工程。
《工业大数据分析算法实践》适合工业大数据分析从业者、工业企业研发技术人员、工业互联网企业数据分析师阅读,也可作为上述人员的培训教材和相关专业师生的参考书。
關於作者:
田春华
博士,北京工业大数据创新中心首席数据科学家,清华大学工业大数据研究中心,首席数据科学家;曾任IBM中国研究院研究经理,IEEE、INFORMS、ACM等学术组织及国际学术会议分会主席、执行委员、国际学术期刊审稿人。长期负责数据挖掘算法研究和产品工作,在高端装备制造、石油石化、新能源、航空与港口等行业,帮助几十家国内外领先企业成功实施资产管理、运营优化、营销洞察等数据分析项目。参与了多个工业大数据相关标准的制定工作、白皮书的编写工作、竞赛支持工作。发表论文近百篇,拥有40余项国际国内发明专利授权。
目錄
丛书序一
丛书序二
前言
第1章 工业大数据分析概览 1
1.1 工业大数据分析的范畴与特点 1
1.1.1 数据分析的范畴 1
1.1.2 典型分析主题 2
1.1.3 工业数据分析的特点 4
1.1.4 数据分析的典型手段 5
1.2.1 CRISP-DM简介 9
1.2.2 分析课题的执行路径 10
1.3.1 脚本语言软件 12
1.3.2 图形化桌面软件 13
1.3.3 云端分析软件 14
1.4.1 分析算法理解的维度与路径 15
1.4.2 必读图书 16
1.4.3 分析算法背后的朴素思想 18
1.4.4 工程化思维 20
2.1 数据操作基础 23
2.1.1 数据框的基本操作 23
2.1.2 数据可视化 24
2.2.1 cumsum等primitive函数的利用:避免循环 25
2.2.2 带时间戳的数据框合并 26
2.2.3 时序数据可视化:多个子图共用一个x轴 29
2.2.4 时序数据可视化:NA用来间隔显示时序 31
2.2.5 参数区间的对比显示(在概率密度图上) 31
2.2.6 获取R文件的所在路径 32
2.2.7 分段线性回归如何通过lm()实现 33
2.3.1 引言 33
2.3.2 R语言EDA包 34
2.3.3 其他工具包 36
2.3.4 小结 37
2.4.1 数据的业务化 38
2.4.2 业务的数据化 41
2.4.3 机理演绎法 45
2.4.4 细致求实的基本素养 48
2.4.5 小结 50
2.5.1 基于数据类型的特征提取 51
2.5.2 基于关联关系的特征自动生成 54
2.5.3 基于语法树的变量间组合特征生成 55
2.6.1 特征选择的框架 56
2.6.2 搜索策略 57
2.6.3 子集评价 59
2.6.4 小结 65
3.1 统计分析 67
3.1.1 概率分布 69
3.1.2 参数估计 69
3.1.3 假设检验 72
3.2.2 基于核函数的非参数方法 73
3.2.3 单概率分布的参数化拟合 76
3.2.4 混合概率分布估计 79
3.2.5 小结 81
3.3.1 引言 82
3.3.2 基础线性回归模型———OLS模型 82
3.3.3 OLS模型检验 85
3.3.4 鲁棒线性回归 91
3.3.5 结构复杂度惩罚(正则化) 94
3.3.6 扩展 94
3.4.1 引言 96
3.4.2 前向计算过程 98
3.4.3 后剪枝过程 99
3.4.4 变量重要性评价 99
3.4.5 MARS与其他算法的关系 100
3.5.1 ANN逼近能力的直观理解 101
3.5.2 极限学习机 106
3.6.1 决策树的概念 111
3.6.2 决策树构建过程 112
3.6.3 常用决策树算法 113
3.7.1 引言 117
3.7.2 epsilon-SVR算法 118
3.7.3 nu-SVR算法 122
3.7.4 不同SVM算法包的差异 123
3.7.5 扩展 124
3.8.1 引言 124
3.8.2 工作原理 125
3.8.3 示例 126
3.8.4 讨论 128
3.9.1 引言 129
3.9.2 朴素贝叶斯 130
3.9.3 贝叶斯网络 131
3.9.4 一般图模型 134
3.9.5 讨论与扩展阅读 140
3.10.1 引言 141
3.10.2 Bagging方法 142
3.10.3 Boosting方法 143
3.10.4 Stacking方法 149
3.11.1 引言 157
3.11.2 评价指标 157
3.11.3 评价方法 163
3.11.4 特征重要度 165
3.12.1 引言 167
3.12.2 基于距离的聚类:K-means、PAM 167
3.12.3 基于层次的聚类:Hclust 169
3.12.4 基于密度的聚类:DBSCAN 171
3.12.5 基于分布的聚类:GMM 173
3.12.6 聚类结果的评价 173
3.13.1 引言 176
3.13.2 关联规则概念与度量指标 176
3.13.3 关联规则实现过程 176
3.13.4 关联规则算法 177
3.13.5 关联规则可视化 180
3.13.6 关联规则评价 182
3.14.1 引言 183
3.14.2 深度学习算法分类 183
3.14.3 深度学习框架 189
3.14.4 常见疑惑 194
3.14.5 深度学习算法的加速 196
3.15.1 计算负载模式 196
3.15.2 并行化计算 199
3.15.3 新计算范式 200
4.1 时序算法简介 210
4.2.1 傅里叶变换的直观理解 212
4.2.2 时频分析 216
4.2.3 时序变换 223
4.2.4 压缩感知 230
4.3.1 STL 234
4.3.2 奇异谱分析 238
4.3.3 EMD及扩展方法 245
4.4.1 Changepoint 250
4.4.2 TreeSplit 253
4.4.3 Autoplait 254
4.4.4 应用示例 255
4.6.1 数值型频繁模式 264
4.6.2 符号型频繁模式 266
4.7.1 基于度
內容試閱
前 言
在过去的五年中,笔者有幸深入制造业数字化转型一线,在与工业龙头企业深入交流和合作的过程中,目睹了国内产业数据基础的快速发展,也看到了数据思维模式的转变和对数据技术的理性认知。回想早年,为了验证数据分析技术,只能跨越地域、克服语言和文化的差异,到境外实施项目,不禁感慨万千。在过去的二十年中,数据平台技术、数据分析算法、计算资源技术和产业需求相互促进而蓬勃发展,数据思维成为了继逻辑思维、实证思维和构造思维之后的第四大思维范式。七十多年以来,大家一直在探索如何让计算机不用显式编程就能获得一定能力的人工智能技术之路,经历了符号演算、逻辑推理、自动机模型、进化计算、模糊数学、专家系统与知识工程、神经网络(特别是自动梯度计算与反演算法)、机器学习、深度学习等不同模式和阶段。得益于计算机硬件、产业数据的发展,机器学习和深度学习在行业应用已经取得了重大成功。但人工智能探索之路远未结束,科学家还在继续研究基于认知和进化等特点的强人工智能技术。另外,对于复杂系统的刻画与建模方法,也期待一些形式化方法的突破。古人有云,物含妙理总堪寻。
在过去五年的工程实践中,不时有工业界朋友提出,期望有本书能从算法应用的角度具象讲解工业数据分析课题。但我一直犹豫,一来市面上已经存在很多机器学习算法经典专著,也有很多优秀的算法工具图书,没有必要做重复工作;二来我与团队当时认为行业数据分析项目不落地的主要原因是分析课题定义不规范和数据不完备,而不是算法过程。因此,我们优先编写了《工业大数据分析实践》一书,尝试规范不同类型工业分析课题的定义过程。然而在该书出版后的几个月内,很多业界朋友再次表达类似的诉求,让我也逐渐意识到这种需求主要来自于工科背景人看问题的角度与统计思维不同,结构方程的惯性让大家下意识抵触非参数模型、隐性结构模型等计算模型。
本书尝试用工科人熟悉的思维模式去解释常见的机器学习算法。很多算法知识展开都可以单独成书,本书无意做重复工作,因此,本书中刻意避免了详尽的理论推导过程,仅讨论必要的理论思路和常见的认知障碍;在存在既有工具或图书的地方,直接给出参考文献,帮助读者快速建立起系统的认知框架;简化算法包使用过程的介绍,侧重算法背后的工作机制和超参数的影响分析,以及算法应用到工业场景中的套路。由此,本书的风格更像数据分析算法的辅助教材,侧重培养行业数据分析实操中的直觉研判力。
本书共10章,可划分为四个部分。第一部分(即第1章)是数据分析概览,目的是建立起数据分析算法的概念框架,并给出学习路线;第2~5章是第二部分,侧重在通用数据分析算法,包括数据预处理、机器学习、时序挖掘算法和最优化等其他算法;第三部分包括第6~8章,讨论了工业分析的算法思路,覆盖了生产质量分析(PQM)、生产效率优化(PEM)等典型分析课题的算法组合套路;第四部分侧重在分析工程方法,第9章讨论了工业专家知识沉淀方法,第10章讨论了数据分析的软件工程。
基于PHM(Prognostics and HealthManagement,故障预测与健康管理)系统的工业设备/系统故障诊断是工业大数据分析中的一个重要领域,存在着丰富有效的研究成果与行业应用。笔者与团队对近20年间的主要学术期刊与会议论文进行了调研,分为工业设备故障诊断、工业系统故障诊断、健康评估三大主题,每个主题下按照机器学习算法进行了分类总结,覆盖了行业问题、技术挑战、方法路线和应用效果等内容,形成了近100页的文献综述文档。原本计划将其单独成章,考虑到内容的特点、读者检索论文的便捷性及本书篇幅限制等因素,笔者决定将这些内容以电子文档资源的形式分享出来,读者可关注本书封底的“科技电眼”公众号,发送“9787111709619”获取该文档。
在本书的编写过程中,实习生李洋、高颂提供了很大的帮助,整理了3.3节、3.11~3.14节和第5章的初稿内容,并完成了工业设备/系统故障诊断电子文档部分插图的翻译工作,6.3节的内容来源于李洋实习期间的合作研究。9.7节部分内容来自马国,图6-18来自曾聿赟,这里一并表示感谢。感谢清华大学数据治理研究中心孙雪老师和机械工业出版社吕潇老师在选题立意上的研讨与建议,你们的热情给了我写下去的信心。特别感谢机械工业出版社的编辑和各位审阅老师在底稿的编审过程中大量富有成效的工作,致敬在本书出版过程中的全体工作人员。本书权当对于工业大数据分析算法的一些初步探讨。鉴于精力和篇幅限制,仅仅覆盖有限的典型算法,内容存在欠缺。再加上笔者才疏学浅,不少提法和表达尚欠推敲,书中难免有疏漏、错误之处,还望广大读者不吝赐教,日后有机会加以勘正。
田春华2021年12月于北京

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.