新書推薦:
《
中国妖怪故事(全集·增订版)
》
售價:HK$
221.8
《
于胥斯原 乡族、风水与地方记忆
》
售價:HK$
177.0
《
以经治国与汉代社会
》
售價:HK$
98.6
《
我真正想要什么?:智慧瑜伽答问/正念系列
》
售價:HK$
58.2
《
元朝理财记 从成吉思汗的崛起到元朝的衰亡
》
售價:HK$
98.6
《
欧洲史:一本书历览欧洲数千年兴衰起伏,理解欧洲文明何以铸就今日世界
》
售價:HK$
333.8
《
趣学CCNA——路由与交换(第2版)
》
售價:HK$
100.6
《
世界航空地理(世界国别与区域地理研究丛书)
》
售價:HK$
244.2
|
編輯推薦: |
大嘴巴带你玩转数据挖掘
让你知道啤酒君和尿布君为什么会相遇,大数据的小科普让你成为“读心”魔法师!
数据挖掘私人定制 轻松掌控再无敌手
拒绝枯燥越过三境 火爆网络疯狂下载
|
內容簡介: |
《大嘴巴漫谈数据挖掘(全彩)》从最基本的概率统计学开始,全面、系统、形象而又深入地描述了数据挖掘的基础概念、应用领域以及常用算法。其中每一种数据挖掘算法都辅以通俗易懂的实例,读者能够在直观性、趣味性中学习算法的具体流程,明白算法的实现过程。通过《大嘴巴漫谈数据挖掘(全彩)》的学习,读者可以对数据挖掘的概念、应用和算法技术有一个清晰的理解和认识,并可以熟悉相关统计学的基本原理。
《大嘴巴漫谈数据挖掘(全彩)》适合想从事数据挖掘方面的工作的初学者、数据分析爱好者、分析师,以及一线的数据挖掘开发人员参考阅读,也适合客户经理针对如何开展针对性的营销活动,避免客户流失而阅读学习,更适合产品经理阅读,因为针对如何预测产品的目标用户,促进用户活跃和业务有效使用,靠经验已经不行了,数据才最有说服力,更适合企业管理者将其作为一本通俗易懂的数据挖掘基础读物阅读学习,对下属的工作方向给予指导,以及适合教师学生数据挖掘课程辅导之用。
|
關於作者: |
易向军:北京科技大学计算机硕士学历,长期工作于互联网和电信领域,目前创办dazui8.com,致力于数据挖掘知识的宣传推广以及相关技术的研发探索。新浪微博:http:weibo.comyixiangjun78 @易向军-数据
浅醉斛觞意渐乱,浮生聚散人堪愁
|
目錄:
|
第一境昨夜西风凋碧树。独上高楼,望尽天涯路…… 10
1.1数据挖掘简介 11
开篇点题引五问 12
大数据中求价值 13
定义概述归特点 14
知识决策跨领域 15
架构特征多形式 17
数据立方展多维 19
功能挖掘四大类 22
分类刻画类标识 23
数据聚类辨亲疏 24
预测未来训模型 25
关联源自购物篮 27
模型过程方法论 28
十大算法成经典 32
1.2数据挖掘应用 33
行业推广多应用 34
用户为王放心中 36
指导运营全周期 37
定位目标寻用户 38
精准营销成闭环 39
交叉产品有关联 40
细分用户刻画像 41
用户体验模型化 43
指标评测建体系 44
流失预警保用户 45
跟踪评估验效果 47
第二境衣带渐宽终不悔,为伊消得人憔悴…… 48
2.1概率定义 49
浮生难料尽偶然 50
一枚硬币抛正反 51
引出随机小试验 53
样本空间样本点 54
事件三分包万象 55
试验频率需频繁 58
次数无限值极限 59
描述概率定特点 60
古典概型等可能 61
事件B后A在前 62
求出概率称条件 65
独立事件A和B 67
抽签中奖公平性 71
常用概率两公式 76
交空并全划样本 77
综合状态全概率 78
前因后果贝叶斯 80
2.2随机变量 81
随机试验数量化 82
统计规律双类型 83
离散变量分布律 84
硬币抛掷是一零 85
分布函数连续型 87
函数求导得密度 89
高斯分布称正态 91
标准正态分位点 95
2.3数字特征 98
随机变量有特征 98
平均取值是期望 100
方差衡量偏离值 101
标准开根同量纲 103
变量关系协方差 104
相关系数相关度 105
研究总体要抽样 108
抽样分布统计量 109
2.4参数估计 111
最小二乘估参数 112
极大似然大概率 116
区间估计置信度 119
2.5假设检验 123
总体假设来检验 124
服从正态抽样本 125
统计量中验假设 126
弃真取伪两错误 127
显著检验小概率 128
小概率中拒绝域 130
检验流程出决策 131
已知总体方差值 132
检验中验均值 133
第三境众里寻她千百度,蓦然回首,那人却在,灯火阑珊处。 134
3.1关联规则 135
购物篮中找关联 136
数据事务若干项 137
事务空间含项集 138
置信支持提升度 142
规则源于频繁项 145
k项连接和剪枝 146
生成非空规则集 148
关联效果来评估 149
3.2决策树 155
决策思维成树形 156
分类预测工作流 161
原理基于信息熵 162
信息增益条件熵 164
节点拆分选特征 170
3.3贝叶斯 186
预测分类贝叶斯 187
类别概率要最大 188
分类数据新预测 195
3.4聚类分析 196
物以类聚人以群 197
样本变量定矩阵 198
R型Q型换空间 199
距离度量相似度 200
系数聚类统计量 202
标准样本选欧氏 203
层次聚合归大类 205
3.5神经网络 209
神经网络神经元 210
神经元中有加权 211
输入映射输出层 213
求出误差调参数 214
权重偏置学习率 216
实例分析模型流 217
3.6线性回归 222
研究身高引回归 223
单自变量归一元 224
最小二乘估回归 226
数据差异总离差 228
分为解释和误差 229
判定系数拟合度 230
多元回归建方程 231
回归面中展二元 233
求得回归系数解 234
衡量拟合验效果 236
3.7逻辑回归 237
因变量中二分类 238
二项逻辑回归式 240
极大似然解方程 242
预测分类符合率 244
3.8因子分析 245
相关变量纳因子 246
因子构造筑模型 248
因子载荷统计性 251
衡量信息共同度 252
方差贡献重要性 253
因子分析四步曲 254
构造因子求载荷 255
旋转因子得命名 260
因子组合求得分 265
3.9信度分析 268
设计问卷来调研 269
信度检验可靠性 270
3.10效度分析 272
结构方程协方差 273
测量模型内外生 276
结构模型潜变量 279
效度分析路径图 280
提出假设依理论 281
固定负荷识模型 282
相关阵中估参数 283
|
|