登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書

『簡體書』数据挖掘

書城自編碼: 4127243
分類:簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 吕欣,王梦宁
國際書號(ISBN): 9787030818447
出版社: 科学出版社
出版日期: 2024-12-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 85.8

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
走向现代:东亚现代人的起源与演化
《 走向现代:东亚现代人的起源与演化 》

售價:HK$ 115.6
蜉蝣国度
《 蜉蝣国度 》

售價:HK$ 73.2
中国兰花名品珍品鉴赏图典(第四版)
《 中国兰花名品珍品鉴赏图典(第四版) 》

售價:HK$ 410.6
老年
《 老年 》

售價:HK$ 115.6
20世纪的设计
《 20世纪的设计 》

售價:HK$ 107.8
短线猎金
《 短线猎金 》

售價:HK$ 57.2
DK伟大的城市地图
《 DK伟大的城市地图 》

售價:HK$ 217.8
人工智能的多视角审视  “人类智能与人工智能”书系(第一辑)
《 人工智能的多视角审视 “人类智能与人工智能”书系(第一辑) 》

售價:HK$ 217.8

內容簡介:
《数据挖掘》内容涵盖统计描述、相关分析、回归分析、数据降维、关联规则挖掘、分类、聚类、异常检测和集成学习等数据挖掘9大核心领域。通过原理解析、数学推导、流程分析、计算示例和案例演示,精心设计231个图表、47个代码示例及5大类学习模块,遴选了45个实践案例,全方位促进读者对内容的理解和掌握。此外,《数据挖掘》还配套丰富的数字化学习资源和全套教辅资料,形成了理论与实践并重的立体化教学体系。
目錄
目录
第1章 绪论
1.1 大数据时代 2
1.2 大数据基本概念 3
1.2.1 大数据定义与内涵 3
1.2.2 大数据的主要特征 4
1.3 大数据与数据挖掘 6
1.3.1 大数据挖掘相关概念 6
1.3.2数据挖掘基本流程 7
1.3.3数据挖掘技术体系 9
1.3.4 大数据时代的挑战 15
1.4 大数据挖掘的典型应用 17
1.4.1 金融大数据 17
1.4.2 医疗大数据 18
1.4.3 制造业大数据 19
1.4.4 社交媒体大数据 20
1.5 大数据挖掘隐私与伦理问题 20
1.5.1 数据挖掘隐私问题 20
1.5.2 数据挖掘伦理问题 22
1.5.3 数据挖掘行为规范 22
本章小结 24
第2章 数据描述与统计指标
2.1 数据预处理 26
2.1.1 数据预处理概要 26
2.1.2 数据清洗 27
2.1.3 数据集成 32
2.1.4 数据獅 33
2.1.5 数据变换 37
2.1.6 实践案例:线上零售交易数据预处理 39
2.2 数据属性 40
2.2.1 标称属性 40
2.2.2 系数属性 41
2.2.3 数值属性 42
2.2.4 离散属性与连续属性 43
2.3 数据描述性统计 43
2.3.1 集中趋势度量 44
2.3.2 离散程度度量 46
2.3.3 分布形态度量 50
2.3.4 描述性统计常用工具 52
2.3.5 实践案例:化妆品销售数据描述性统计分析 53
2.4 数据可视化 54
2.4.1 条形图 55
2.4.2 饼图 56
2.4.3 箱线图 56
2.4.4 直方图 57
2.4.5 折线图 57
2.4.6散点图 58
2.4.7 气泡图 59
2.4.8 数据可视化常用工具 60
2.4.9 实践案例:钻石属性数据可视化分析 60
本章小结 64
第3章 相关分析
3.1 认识函数关系与相关关系 67
3.1.1 函数关系 67
3.1.2 相关关系 67
3.2 线性相关分析 69
3.2.1 相关分析的正态性检验 70
3.2.2 Pearson 相关系数 72
3.2.3 Spearman 秩相关系数 72
3.2.4 Kendall等级相关系数 74
3.2.5 实践案例:网络直播大数据和亚马逊评论数据相关分析 76
3.3 非线性相关分析 79
3.3.1 认识非线性相关性 79
3.3.2 互信息 80
3.3.3 最大信息緣 82
3.3.4 实践案例:桥梁振动的相关分析 83
3.4 偏相关分析 85
3.4.1 偏相关分析概述 85
3.4.2 实践案例:国内主要城市年度统计指标数据偏相关分析 87
3.5 距离相关分析 89
3.5.1 距离度量方法 89
3.5.2 实践案例:用户相似性度量 94
本章小结 98
第4章 回归分析
4.1 回归分析概论 101
4.1.1 高尔顿身高回归研究 101
4.1.2 回归分析概述 102
4.1.3 回归模型的评价指标 103
4.2 线性回归 105
4.2.1 一元线性回归 105
4.2.2 实践案例:直播平台观众数预测 108
4.2.3 多元线性回归 110
4.2.4 实践案例:基于多元线性回归的汽车燃油效率预测 114
4.3 多重共线性 117
4.3.1 认识多重共线性 117
4.3.2 多重共线性的诊断 118
4.3.3 多重共线性的解决方案 119
4.4 岭回归 120
4.4.1 岭回归概述 120
4.4.2 岭参数的选择 121
4.4.3 实践案例:基于岭回归的汽车燃油效率预测 122
4.5 LASSO 回归 123
4.5.1 LASSO 回归概述 123
4.5.2 坐标下降法 124
4.5.3 实践案例:基于LASSO回归的汽车燃油效率预测 125
4.6 非线性回归 127
4.6.1 本质线性模型 127
4.6.2 本质非线性模型 129
4.6.3 实践案例:基于工龄的月薪预测 129
本章小结 133
第5章 数据降维
5.1 降维的基本概念 136
5.1.1 降维的定义及原理 136
5.1.2 降维算法分类 136
5.2 奇异值分解 137
5.2.1 奇异值分解基本原理 137
5.2.2 奇异值分解算法评价 140
5.2.3 实践案例:基于奇异值分解的图像压缩 140
5.3 主成分分析 142
5.3.1 主成分分析基本原理 142
5.3.2 主成分分析算法评价 146
5.3.3 实践案例:基于主成分分析的鸢尾花数据集分析 147
5.4 因子分析 150
5.4.1 因子分析基本原理 150
5.4.2 因子分析算法评价 156
5.4.3 实践案例:基于因子分析的人格特征潜在因子挖掘 156
5.5 多维尺度变换 158
5.5.1 多维尺度变换基本原理 158
5.5.2 多维尺度变换算法评价 160
5.5.3 实践案例:基于多维尺度变换的人脸数据集降维 160
5.6 等距特征映射 163
5.6.1 等距特征映射基本原理 163
5.6.2 等距特征映射算法评价 165
5.6.3 实践案例:基于等距特征映射的S状流形模型降维 165
5.7 线性判别分析 167
5.7.1 线性判别分析基本原理 167
5.7.2 线性判别分析算法评价 170
5.7.3 实践案例:基于线性判别分析的三维数据集降维 170
5.8 t-SNE 172
5.8.1 t-SNE基本原理 172
5.8.2 t-SNE算法评价 175
5.8.3 实践案例:基于t-SNE的手写数字数据集降维 175
5.9 UMAP 177
5.9.1 UMAP算法基本思想 177
5.9.2 UMAP算法评价 179
5.9.3 实践案例:基于UMAP的手写数字数据集降维 179
本章小结 181
第6章 关联规则挖掘
6.1 关联规则挖掘概要 184
6.1.1 关联规则的含义 184
6.1.2 频繁项集 186
6.1.3 闭频繁项集和极大频繁项集 187
6.1.4 从频繁项集到关联规则 189
6.1.5 关联模式的评估 191
6.2 Apriori 算法 197
6.2.1 Apriori算法基本原理 197
6.2.2 Apriori算法应用与评价 198
6.2.3 Apriori算法的优化 200
6.2.4 实践案例:基于Apriori算法的超市商品购买记录关联分析 202
6.3 FP-growth 算法 204
6.3.1 FP-growth算法基本原理 204
6.3.2 FP-growth算法应用与评价 209
6.3.3 实践案例:基于FP-growth算法消费者购物时间偏好关联分析 209
6.4 Eclat 算法 211
6.4.1 Eclat算法基本原理 211
6.4.2 Eclat算法应用与评价 213
6.4.3实践案例:基于Eclat算法的糖尿病症状关联分析 213
6.5 H-mine 算法 216
6.5.1 H-mine算法基本原理 216
6.5.2 H-mine算法应用与评价 221
6.5.3 实践案例:基于H-mine算法的新闻** 221
本章小结 224
第7章 分类
7.1 分类霞概要 227
7.1.1 分类定义及原理 227
7.1.2 常用分类算法 227
7.1.3 分类算法评价指标 228
7.2 K-近邻 232
7.2.1 K-近邻基本原理 232
7.2.2 K-近邻主要参数 233
7.2.3 K-近邻算法应用与评价 234
7.2.4 实践案例:基于K-近邻的广告点击预测 234
7.3 朴素贝叶斯分类 237
7.3.1 贝叶斯分类基本原理 237
7.3.2 朴素贝叶斯分类原理 238
7.3.3 零频现象的拉普拉斯修正 240
7.3.4 朴素贝叶斯算法应用与评价 241
7.3.5 实践案例:基于朴素贝叶斯预测恒星类型 241
7.4 决策树 244
7.4.1 决策树基本原理 245
7.4.2 ID3 247
7.4.3 C4.5 250
7.4.4 CART 252
7.4.5 决策树算法应用与评价 254
7.4.6 实践案例:基于决策树的旅游业客户流失预测 255
7.5 Logistic 回归 258
7.5.1 从线性回归到Logistic回归 258
7.5.2 Logistic回归的损失函数 260
7.5.3 通过梯度下降求解*优参数 260
7.5.4 OvR和OvO 262
7.5.5 Logistic回归算法应用与评价 263
7.5.6 实践案例:基于Logistic回归的肝病预测 263
7.6 支持向量机 265
7.6.1 支持向量机概述 266
7.6.2 线性可分支持向量机 266
7.6.3 线性支持向量机 270
7.6.4 非线性支持向量机 273
7.6.5 支持向量机算法应用与评价 276
7.6.6 实践案例:不良用户识别 277
7.7 人工神经网络 278
7.7.1 感知机 278
7.7.2 XOR问题 280
7.7.3 多层感知树莫型 281
7.7.4 误差反向传播算法 284
7.7.5 深度神经网络 288
7.7.6 实践案例:基于面部特征的性别分类 290
本章小结 293
第8章 聚类
8.1 聚类算法概要 295
8.1.1 聚类的基本原理 295
8.1.2 聚类算法的分类 296
8.1.3 聚类算法评价指标 297
8.1.4 簇数量的确定 303
8.2 层次聚类 305
8.2.1 层次聚类算法基本原理 305
8.2.2 层次聚类算法应用与评价 307
8.2.3 实践案例:基于层次聚类的小麦种子聚类 307
8.3 K-means聚类 309
8.3.1 K-means算法基本原理 309
8.3.2 质心的初始化 310
8.3.3 K-means算法应用与评价 311
8.3.4 实践案例:基于K-means消费者画像构建 311
8.4 高斯混合聚类 313
8.4.1 高斯混合聚类基本原理 314
8.4.2 高斯混合聚类流程 315
8.4.3 高斯混合聚类应用与评价 316
8.4.4 实践案例:基于高斯混合聚类的食品聚类 316
8.5 DBSCAN算法 318
8.

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2025 (香港)大書城有限公司  All Rights Reserved.