登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2025年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書

『簡體書』数据分析与数据挖掘

書城自編碼: 4176828
分類:簡體書→大陸圖書→計算機/網絡數據庫
作者: 姜维
國際書號(ISBN): 9787121447433
出版社: 电子工业出版社
出版日期: 2024-12-01

頁數/字數: /

售價:HK$ 98.8

我要買

** 我創建的書架 **
未登入.



新書推薦:
读懂RWA
《 读懂RWA 》

售價:HK$ 86.9
复合型AI Agent开发:从理论到实践
《 复合型AI Agent开发:从理论到实践 》

售價:HK$ 108.9
选择的权利:推翻罗诉韦德案(译文纪实系列)
《 选择的权利:推翻罗诉韦德案(译文纪实系列) 》

售價:HK$ 129.8
符号空间:品牌建筑空间媒介化研究
《 符号空间:品牌建筑空间媒介化研究 》

售價:HK$ 137.5
宫门内外:阴云下的政变
《 宫门内外:阴云下的政变 》

售價:HK$ 71.5
从阅读到输出:靠大量阅读年入7位数 每天15分钟读写闭环,启动人生复利增长系统
《 从阅读到输出:靠大量阅读年入7位数 每天15分钟读写闭环,启动人生复利增长系统 》

售價:HK$ 76.8
世上要有天一阁
《 世上要有天一阁 》

售價:HK$ 74.8
精确科学的常识 天才数学家克利福德
《 精确科学的常识 天才数学家克利福德 》

售價:HK$ 41.8

內容簡介:
本书重点讲述统计数据分析方法和数据挖掘技术,在大数据时代和人工智能时代,数据驱动的知识抽取技术成为一项重要学习和研究内容。本书采用理论和举例相结合的方式进行数据分析和数据挖掘知识讲解,并配套《数据分析与数据挖掘建模工具》一书,便于理论和实践相结合。书中内容包括统计检验、方差分析、回归分析、关联分析、分类模型、聚类模型、离群点分析等典型的数据分析和数据挖掘方法。
目錄
目 录

第1章 数据分析与数据挖掘基础1
1.1 数据分析与数据挖掘需求1
1.1.1 数据分析与数据挖掘1
1.1.2 大数据处理需求2
1.1.3 数据分析误区与隐私问题3
1.2 数据分析与数据挖掘的工作过程3
1.2.1 数据分析的主要工作过程3
1.2.2 数据收集5
1.2.3 数据展示6
1.3 数据的组织和数据的类型7
1.3.1 数据的一般组织形式7
1.3.2 数据类型8
1.3.3 分类数据的编码9
1.4 数据的常用描述性统计量11
1.4.1 数据的中心趋势11
1.4.2 数据的离散程度12
1.4.3 数据的形态统计量15
1.5 数据的基本描述性统计分析18
1.5.1 数据的描述性统计18
1.5.2 五数概括与盒图19
1.5.3 数据的描述性统计图20
1.6 本章小结22
本章概念与关键词22
练习与思考23
第2章 数据抽样与推断检验24
2.1 随机变量概率分布24
2.1.1 概率分布24
2.1.2 正态分布26
2.1.3 二项分布与泊松分布28
2.1.4 几何分布与超几何分布29
2.2 抽样统计分析31
2.2.1 抽样的相关概念31
2.2.2 概率抽样的典型方法33
2.2.3 非随机抽样的典型方法34
2.3 基本抽样分布34
2.3.1 经验分布、理论分布与抽样分布34
2.3.2 三大抽样分布36
2.3.3 小概率事件38
2.4 常用的抽样分布与区间估计40
2.4.1 常用的统计量抽样分布40
2.4.2 置信区间与区间估计42
2.5 常用的参数检验45
2.5.1 假设检验一般过程45
2.5.2 常用的参数检验统计量47
2.6 常用的单样本非参数检验48
2.6.1 卡方检验48
2.6.2 二项分布检验49
2.6.3 固定参数的超几何分布检验49
2.6.4 游程检验50
2.6.5 单样本K-S检验54
2.7 本章小结56
本章概念与关键词57
练习与思考57
第3章 可视化图与分组检验59
3.1 数据的常用可视化图分析59
3.1.1 数据的常用可视化图59
3.1.2 基于图的可视化观测一般过程62
3.2 均值比较和t检验62
3.2.1 分组统计62
3.2.2 数据标准化与Z-Score63
3.2.3 单样本t检验64
3.2.4 两独立样本t检验65
3.2.5 两配对样本t检验67
3.3 方差齐性检验68
3.3.1 Levene方差齐性检验68
3.3.2 基于F检验的方差齐性检验69
3.3.3 Brown-Forsythe方差齐性检验70
3.3.4 Bartlett’s方差齐性检验70
3.4 两独立样本的非参数检验71
3.4.1 Mann-Whitney U检验71
3.4.2 两独立样本K-S检验74
3.4.3 两独立样本游程检验76
3.4.4 两独立样本Moses极端反应检验77
3.4.5 两独立样本Brown-Mood中位数
检验78
3.5 两配对样本的非参数检验81
3.5.1 两配对样本符号检验81
3.5.2 中位数、分位数及比例的符号
检验82
3.5.3 两配对样本Wilcoxon符号秩
检验83
3.5.4 Wilcoxon符号秩单样本检验85
3.5.5 两配对样本McNemar检验86
3.5.6 边缘齐性检验88
3.6 多样本的非参数检验88
3.6.1 多独立样本中位数检验88
3.6.2 多独立样本Kruskal-Wallis检验90
3.6.3 多独立样本Jonckheere-Terpstra
检验91
3.6.4 多配对样本Friedman检验94
3.6.5 多配对样本Kendall协同系数
检验96
3.6.6 多配对样本Cochran’s Q检验97
3.7 本章小结98
本章概念与关键词99
练习与思考99
第4章 方差分析与相关性分析102
4.1 方差分析102
4.1.1 方差分析中的变量102
4.1.2 单因素方差分析103
4.1.3 单因素方差Brown-Forsythe
检验105
4.1.4 单因素方差Welch’s t检验106
4.1.5 无交互作用的双因素方差分析107
4.1.6 有交互作用的双因素方差分析109
4.2 Post Hoc检验111
4.2.1 LSD检验111
4.2.2 Studentized极差分布112
4.2.3 Tukey’s Range检验113
4.2.4 Tukey-Kramer检验115
4.2.5 SNK检验117
4.2.6 其他几种常用检验方法118
4.3 连续属性数据的相关性分析119
4.3.1 协方差的线性相关性度量119
4.3.2 相关系数的线性相关性度量122
4.3.3 Spearman秩相关系数124
4.4 离散属性相关性分析126
4.4.1 交叉列联表分析126
4.4.2 用卡方检验进行离散相关性分析127
4.4.3 列联表上常用的指标128
4.4.4 Fisher’s exact检验129
4.5 本章小结131
本章概念与关键词132
练习与思考132
第5章 数据的预处理与距离分析134
5.1 数据的预处理134
5.1.1 数据清理134
5.1.2 数据集成136
5.1.3 数据变换137
5.1.4 数据归约137
5.2 数据的常用组织方式138
5.2.1 数据的常用逻辑组织138
5.2.2 数据的常用物理组织139
5.2.3 高精度计算与矩阵计算139
5.2.4 编程语言、软件工具140
5.3 相似度计算与距离分析140
5.3.1 相似度与距离的转换140
5.3.2 闵可夫斯基距离143
5.3.3 马氏距离145
5.3.4 混合属性的相似度与距离147
5.4 kNN分类模型148
5.4.1 kNN分类模型概述148
5.4.2 距离加权kNN分类模型150
5.5 参数的点估计151
5.5.1 原点矩与中心矩151
5.5.2 矩估计法152
5.5.3 极大似然估计法153
5.6 本章小结156
本章概念与关键词156
练习与思考156
第6章 回归分析158
6.1 一元线性回归158
6.1.1 一元线性回归问题描述158
6.1.2 一元线性回归模型与求解159
6.1.3 确认回归方程的精度161
6.1.4 总体回归的方差分析162
6.1.5 残差分析164
6.1.6 回归方程参数检验167
6.1.7 回归方程预测与控制168
6.2 多元线性回归170
6.2.1 多元线性回归问题描述170
6.2.2 多元线性回归模型与求解172
6.2.3 确认回归方程的精度173
6.2.4 残差分析174
6.2.5 回归方程参数检验175
6.2.6 回归方程预测176
6.3 常用的曲线回归177
6.3.1 曲线回归问题177
6.3.2 多项式回归177
6.3.3 指数回归与对数回归179
6.3.4 其他常见曲线回归179
6.4 最小二乘法及其应用179
6.4.1 最小二乘法线性拟合179
6.4.2 伪逆矩阵求解180
6.4.3 Moore-Pseudo逆矩阵181
6.4.4 最小均方误差算法182
6.4.5 非线性回归183
6.4.6 智能优化求解技术183
6.5 Logistic回归184
6.5.1 Logistic回归分类与基本函数184
6.5.2 Logistic回归系数计算185
6.6 本章小结186
本章概念与关键词187
练习与思考187
第7章 空间降维技术189
7.1 主成分分析189
7.1.1 主成分分析描述189
7.1.2 基于协方差矩阵的主成分分析190
7.1.3 基于相关系数矩阵的主成分
分析192
7.1.4 主成分分析与因子分析的联系193
7.1.5 主成分分析的作用194
7.2 因子分析案例研究196
7.2.1 研究的目的与内容196
7.2.2 变量选取与数据来源196
7.2.3 因子分析过程197
7.2.4 因子回归分析198
7.2.5 案例研究结论199
7.3 奇异值分解200
7.3.1 SVD的协同过滤推荐200
7.3.2 SVD在协同过滤中的应用203
7.3.3 SVD增量式协同过滤方法204
7.4 主成分回归与逐步回归205
7.4.1 多重共线性205
7.4.2 主成分回归207
7.4.3 逐步回归207
7.5 本章小结208
本章概念与关键词208
练习与思考209
第8章 关联规则与点对相关性210
8.1 频繁模式与关联规则的基本
概念210
8.1.1 频繁模式的基本概念210
8.1.2 关联规则的基本概念211
8.1.3 极大频繁模式与闭频繁模式212
8.2 频繁模式挖掘213
8.2.1 Apriori算法213
8.2.2 垂直数据格式214
8.2.3 基于频繁模式计算关联规则215
8.3 频繁模式树216
8.3.1 频繁模式树的构建216
8.3.2 频繁模式树的递归过程219
8.4 点对相似度的典型度量220
8.4.1 点对关系常见度量220
8.4.2 点对相关性度量的几种特性222
8.5 信息熵及其应用与点对相关性
度量224
8.5.1 信息熵224
8.5.2 联合熵与互信息226
8.5.3 信息增益、相对熵和交叉熵228
8.5.4 互信息、交叉熵用于相关性229
8.6 本章小结230
本章概念与关键词230
练习与思考231
第9章 决策树232
9.1 分类问题与模型训练232
9.1.1 分类问题描述232
9.1.2 分类问题举例与泛化问题233
9.1.3 分类模型的常见评价指标235
9.2 决策树及ID3算法236
9.2.1 决策树概述236
9.2.2 ID3算法238
9.3 C4.5算法与连续属性特征分
类树241
9.3.1 C4.5算法241
9.3.2 连续属性的决策树构建241
9.4 CART决策树243
9.4.1 CART分类树243
9.4.2 CART回归树244
9.5 决策树剪枝250
9.5.1 剪枝问题的提出与先剪枝技术250
9.5.2 错误率降低剪枝法251
9.5.3 悲观剪枝法251
9.5.4 代价复杂度剪枝法254
9.6 ROC曲线与AUC指标255
9.6.1 ROC曲线描述与绘制255
9.6.2 ROC曲线绘制与作用257
9.6.3 AUC指标与应用258
9.7 本章小结259
本章概念与关键词259
练习与思考260
第10章 贝叶斯分类261
10.1 连续属性贝叶斯分类器261
10.1.1 单个1

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2026 (香港)大書城有限公司  All Rights Reserved.