新書推薦:
《
城市轨道交通绿色低碳规划设计研究——深圳地铁6号线工程创新与实践
》
售價:HK$
221.8
《
艾尔米塔什国家博物馆 少年游学 人一生一定要看的博物馆
》
售價:HK$
38.1
《
世界四大博物馆4册套装 卢浮宫大英大都会艾尔米塔什博物馆 青少年游学艺术参观科普书
》
售價:HK$
152.3
《
艺术家之路 塑造插画风格
》
售價:HK$
166.8
《
古乐钩沉(中国音乐学院60周年校庆中青年学者文集)
》
售價:HK$
132.2
《
我和抑郁症的3000天
》
售價:HK$
66.1
《
与骸骨交谈:我希望每一个真相都被发现
》
售價:HK$
76.2
《
人体使用手册3:自愈力的逻辑(全面解读身体面对疾病时的反应逻辑,学习更多有效的系列家庭按摩)
》
售價:HK$
61.6
|
編輯推薦: |
“CDA数据分析师系列丛书”依照数据分析师规范化学习体系而定。满足了CDA数据分析师等级认证学习的需要,也兼顾了大数据的热点动态。从策划之初一直坚持以“读者需求”为主线,结合企业实际案例和业务场景来谈大数据思维和小数据分析。实现技术扎实,业务精通,策略接地气!
|
內容簡介: |
本书共5章,涉及使用SAS EG做数据分析的主要分析方法。其中,第1章为数据分析方法概述,第2章至第4章为横截面数据分析方法。第5章为时间序列分析方法。每章都根据所涉及的知识点的不同,选取了实用的案例,并为读者准备了相应的思考和练习题。 本书是一本面向商业数据分析初学者的教材,从具体的商业数据分析案例入手,使读者掌握数据分析的目的、理念、思路与分析步骤。本书力图淡化技术,对于方法的介绍也尽量避免涉及过多的数学内容,和高等数学相关的内容只在线形回归和主成分分析这两节中涉及到,而且都辅以图形作形象的展现。因此本书的读者只需要具有高中水平的数学基础即可。
|
關於作者: |
经管之家(www.jg.com.cn):原人大经济论坛,于2003年成立,致力于推动经管学科的进步,传播优秀教育资源,目前已经发展成为国内最大的经济、管理、金融、统计类的在线教育和咨询网站,也是国内最活跃和最具影响力的经管类网络社区。经管之家从2006年起在国内最早开展数据分析培训,累计培训学员数万人。在大数据的趋势背景下,创新“CDA数据分析师”品牌,致力于为社会各界数据分析爱好者提供最优质、最科学、最系统的数据分析教育。截至2016年3月已成功举办40多期系统培训,培训学员达3千余名;CDA认证考试已成功举办三届,报考人数上千人;中国数据分析师俱乐部(CDA CLUB),每周线下免费沙龙活动,已举力40多期,累积会员2千余名;中国数据分析师行业峰会(CDA Summit),一年两届,参会人数皆达2千余名,在大数据领域影响力超前。“CDA数据分析师”队伍在业界不断壮大,对数据分析人才产业起到了巨大的推动作用。常国珍,北京大学商学博士,法学硕士。曾就职于亚信科技BOC部门、方正国际金融事业部、德勤管理咨询信息技术系统咨询部。SAS公司资深讲师,Oracle大数据讲师,多家金融信息部门和金融高科技公司数据挖掘技术顾问。从事征信数据集市与信用风险建模、客户价值提升等数据挖掘项目。擅长基于个体行为分析的价值发现和信用建模。研究方向为宏微观接合研究,兴趣点在于宏观环境变化对微观主体行为的经济后果分析及价值投资。赵仁乾,北京邮电大学管理科学与工程硕士,现就职于北京电信规划设计院,从事移动、联通集团及各省分公司市场、业务、财务规划,经济评价及运营咨询。重点研究方向包括离网用户挖掘、市场细分与精准营销、移动网络价值区域分析、潜在价值客户挖掘等。曾珂,华中师范大学管理科学与工程硕士,现就职于经管之家CDA数据分析研究院,从事互联网、电子商务方向数据分析与数据挖掘的研究,CDA数据分析师的教学工作,研究方向为网络文本挖掘、电商市场细分与客户细分、潜在价值客户挖掘、互联网大数据挖掘等。
|
目錄:
|
第1 章 数据分析方法概述 11.1 数据分析概述 .. 21.1.1 数据分析过程 21.1.2 数据分析的商业驱动 31.2 数据分析与挖掘方法分类介绍 . 51.2.1 描述性——无监督的学习 . 71.2.2 预测性——有监督的学习 .. 101.3 数据分析的方法论 . 121.3.1 数据挖掘的项目管理方法论:CRISP-DM 131.3.2 数据整理与建模的方法论:SEMMA .. 141.3.3 SAS EG 和SPSS 任务菜单编排与SEMMA 之间的关系. 16第2 章 描述数据特征 .. 192.1 认识数据类型 202.2 单变量描述统计方法 212.2.1 分类变量的描述 212.2.2 连续变量的描述 222.3 创建频数报表 352.4 生成汇总统计量 .. 382.5 用汇总表任务生成汇总报表 412.6 绘制条形图 . 462.7 绘制地图 .. 532.8 使用SPSS 进行描述统计 .. 552.8.1 频率过程 .. 562.8.2 描述过程 .. 572.8.3 探索过程 .. 582.8.4 P-P 图与Q-Q 图 582.9 使用SPSS 绘制统计图形 .. 602.9.1 作图方法 .. 602.9.2 饼图、柱图与条图 .. 642.9.3 线图、高低图和双轴图 702.9.4 散点图 73第3 章 描述性数据分析挖掘方法 . 753.1 客户细分方法介绍 . 763.1.1 客户细分的意义 763.1.2 根据客户利润贡献进行划分 . 773.1.3 根据个人或公司的生命历程进行划分 783.1.4 根据客户的产品偏好进行划分 793.1.5 根据客户交易消费行为进行划分 . 803.1.6 根据客户的多维行为属性细分 813.1.7 展现客户产品结构的战略细分 .. 813.1.8 客户细分:综合运用 . 823.2 连续变量间关系探索与变量约减 . 823.2.1 多元统计基础 . 823.2.2 多元变量压缩的思路 . 873.2.3 主成分分析 .. 893.2.4 因子分析 . 1033.2.5 对应分析 . 1123.2.6 最优尺度分析 .. 1193.2.7 多维尺度分析 .. 1243.3 聚类分析 1333.3.1 基本逻辑 . 1343.3.2 系统聚类 . 1353.3.3 快速聚类 . 1463.3.4 两步聚类 . 155第4 章 预测性数据分析方法 .. 1614.1 假设检验概念 . 1624.1.1 统计推断基本概念 1644.1.2 变量分布的图形探索 .. 1654.1.3 均值的置信区间 . 1674.1.4 假设检验基础 .. 1684.1.5 T 检验 . 1694.2 构造对连续变量的预测模型 . 1744.2.1 方差分析(ANOVA) 1744.2.2 线性回归 . 1904.2.3 线性回归的模型诊断 .. 2034.2.4 线性回归的全流程 2114.3 构造对二分类变量的预测模型 2174.3.1 分类变量之间的相关性检验 .. 2174.3.2 逻辑回归 . 224第5 章 时间序列 .. 2405.1 时间序列的趋势分解法 2415.1.1 趋势分解法简介 . 2415.2.2 使用SAS EG 进行时间序列趋势分解 .. 2425.2.3 使用SPSS 进行时间序列趋势分解 2445.2 平稳时间序列(ARMA)模型设定与识别 . 2455.2.1 平稳时间序列定义 2455.2.2 平稳时间序列模型建模 . 2465.2.3 ARMA 的模型设定与识别 .. 2475.3 非平稳时间序列(ARIMA)模型设定与识别 .. 2505.4 SAS EG 时间序列建模步骤 .. 2525.5 SPSS 时间序列建模步骤 . 2585.5.1 SPSS 构造ARIMA 模型使用的任务菜单 .. 2585.5.2 “定义日期”任务 .. 2605.5.3 “序列图”任务 2615.5.4 “自相关”任务 2625.5.5 “创建模型”任务 .. 2635.5.6 “使用模型”任务 .. 2675.5.7 其他内容 . 267附录A 数据说明 .. 271附录B CDA 数据分析师致力于最好的数据分析人才建设 .. 278参考文献 282
|
內容試閱:
|
数据分析过程数据分析的目的是为业务发展答疑解惑。他描述了“过去发生了什么”、“现在正在发生什么”和“未来可能发生什么”。根据分析的级别,分为常规报表、即席查询、多维分析(又称为钻取或者OLAP)、警报、统计分析、预报(或者时间序列预测)、预测型建模(预测性(predictive)模型)和优化(1)常规报表:常规报表广为人知,它们通常按照一定的周期产生,对过去一段时间、一定范围内所发生的事实进行记录。它们对了解业务现状非常有用,但是却无法据此进行长期决策。标准报表主要用于回答“发生了什么”和“什么时候发生”这样的问题。典型的标准报表包括月度或季度的财务报告。(2)即席查询:即席查询往往通过对一系列数据(组合)的要求来“回答”一些常见的业务问题。即席报表主要用于解决类似“多少”、“频次如何”和“在哪里”这样的问题。记录每种产品每天销量的定制报表就属于即席报表。(3)多维分析(又称为钻取或者OLAP 技术):OLAP 技术可以帮助了解更多细节信息,它可以帮助客户自己操纵数据,找出诸如“多少”、“什么”和“哪里”之类问题的答案。OLAP 技术主要解决的是“问题出在哪里”和“我如何找到问题的答案”这样的问题。例如,对不同类型的客户通话行为进行排序,找出他们的通话特征就需要运用到OLAP 技术。(4)警报:当问题发生时你可以通过告警及时获知,并且可以在将来发生类似情况时引起注意。告警可以通过电子邮件、网络频道、记分卡或者仪表盘的形式给出。警报的过程需要确认的是引起注意的触发点,以及一旦报警需要采取什么行动。比如,销售总监在销售情况与销售目标差距大时会收到告警信息。(5)统计分析:我们可以运行一些更加复杂的分析。例如,方差分析和回归分析等。我们可以基于数据提出一些假设,然后再利用数据构建统计分析模型来“回答”这些假设是否成立。统计分析解决的问题主要是“行为事件为什么发生”和“我失去了怎样的机会”。例如,银行希望了解什么样的人,更可能对他们的房子进行转按揭操作,那么他们就会用到统计分析的方法。(6)预报(或者时间序列预测):它能够帮助建立恰当的库存,防止脱销和积压库存带来的机会流失或额外成本。时间序列预测主要解决的问题是“未来的趋势会怎样”和“如果这样的趋势继续会怎样”。例如,零售商可以根据销售历史,预测未来特定店铺的特定产品的销售量,而这样的预测过程就是时间序列预测。(7)预测型建模(预测性模型):如果你有1000 万个客户需要做一次直邮,谁最有可能响应?怎样对现有客户进行有效分群?哪些客户最可能流失?预测性模型可以回答这类问题。预测性模型主要关心的是将来可能发生的情况,以及不同的预测情况对业务的影响。例如,商户可以预测客户可能会对哪种产品更有兴趣,以及哪些客户会对特定产品更有兴趣。(8)优化:优化往往带来创新,它使企业可以在有限资源下实现利润最大化。优化强调的是更好地利用各种资源的途径。例如,在特定资源条件下,如何安排并使利润最大化,就是优化需要解决的问题。前4 类分析提供了关于以往和当前情况的描述,让业务人员对历史情况有一个深入的认识。但是这往往是不够的,这就像在驾驶的时候只看两边和后视镜,而挡住前面的玻璃,对前面发生的情况一无所知。第5 类到第7 类分析提供了向前看的途径,可以预测未来发展的情况,及早发现问题,做到提前准备。而最后一类分析是在掌握了未来发展状况之后,对业务进行优化,制订最优的决策方案。从上面介绍中可以看到,数据分析是和业务紧密联系在一起的,其目的就是满足商业决策的需求。这种决策是以事实和数据分析的结果为基础,结合经验和行业的洞察作出决策。在解读和判断数据模型时,需要融入对业务的理解、融入基于经验的灵感,很多时候是无法用单纯的公式或规则来替代人的智慧和艺术灵感的。因此,数据分析是技术与艺术的结合。如果可以量化分析某些问题,那么就去分析,但别忘记加入你的经验、知识和理性的推断。
|
|