新書推薦:
《
我们终将老去:认识生命的第二阶段(比利时的“理查德·道金斯”,一位行为生物学家的老年有用论
》
售價:HK$
91.8
《
谁是窃书之人 日本文坛新锐作家深绿野分著 无限流×悬疑×幻想小说
》
售價:HK$
55.8
《
一个经济杀手的自白 第3版
》
售價:HK$
110.9
《
8秒按压告别疼痛
》
售價:HK$
87.4
《
津巴多时间心理学:挣脱束缚、改写命运的6种时间观
》
售價:HK$
77.3
《
大英博物馆东南亚简史
》
售價:HK$
177.0
《
纯粹·我只要少许
》
售價:HK$
80.6
《
投机苦旅:一位投机客的凤凰涅槃
》
售價:HK$
88.5
編輯推薦:
(1)数澜出品:数澜科技是国内数据中台领域的领先企业。
(2)作者资深:10余年数据产品经验,数澜研究院院长,原阿里集团数据产品专家,获“数据类目体系”专利。
(3)系统方法论:系统总结标签类目体系方法论,并阐述其原理和实施方法。
(4)工具和模板:提供大量标签工具和模板,提升标签类目体系的设计、使用和运营效率。
(5)* 佳实践:列举5个从标签设计到数据应用的* 佳实践方案,并总结标签化成果价值、商业/社会价值及标签设计人才的培养经验。
內容簡介:
企业数字化转型中Z适合的数据资产组织方式是什么样的?为什么越来越多的企业在讨论标签化和标签体系?数澜独创的标签类目体系方法论有何独到之处?
数据资产化是企业数字化转型的必经之路,也是数据中台的重要组成部分。
标签类目体系是数据中台理念落地的核心组成部分,是实现数据资产可复用、柔性组合使用、降低数据应用试错门槛的强力支撑。
数据作为第五生产要素参与分配,数据资本化的重要前提是数据商品化,数据商品化的Z佳载体就是标签。因此,学习如何将数据转化、映射为标签,并通过对标签的管理、应用实现数据资产的价值运营,对于商业化企业来说显得尤为重要。
本书旨在培养资深的数据资产架构师及数据运营专家,以方法教育而非工具实施的方式助力企业建立自身的数据资产化能力,将数据能力Z大限度地转化为商业价值。
全书共9章,分为3部分。
由来篇(第1~3章)
首先分析了当前各企业在数据建设过程中会遇到的6类主流问题与困难限制;为了应对这些数据问题,逐渐发展出的标签类目体系这一数据资产构建方法论及其定位定义;论述了采用该方法建设数据资产的3点必要性与意义:资产可复用、业务可理解、价值可衡量。
理论篇(第4~6章)
详细讲解了标签类目体系方法论的4条核心原理;从核心原理衍生出的完整设计步骤,包括3个构建前提和6条设计步骤;同时阐述了标签方法论在实施落地过程中的具体使用技法,并探讨了其中的核心问题。
实践篇(第7~9章)
重点介绍了当前可用的标签工具和经典模板,它们可以用来提升标签类目体系的设计、使用、运营效率;列举了5个从标签设计到数据应用的Z佳实践方案;并总结了标签化成果价值、商业/社会价值及标签设计人才的培养经验。
關於作者:
任寅姿(花名:影姿)
资深产品总监、数澜研究院院长
拥有超过10年的数据产品经验,原阿里巴巴集团数据产品专家,曾负责集团消费者标签类目体系、DMP精准营销等系统的数据资产设计与实施。2016年加入数澜科技,负责管理公司产品团队,系统提升团队数据思维、数据资产设计能力及数据服务应用经验,是数据中台理论定义及体系构建的核心参与者。
合著有畅销书《数据中台:让数据用起来》,已获得“数据类目体系”专利,且撰写的多篇论文被国内外核心期刊刊登发表。
季乐乐(花名:寒泉)
政法行业资深专家、产品专家
拥有超过6年的政法行业产品经验,原南京通达海区域负责人,专注于研究数字检务、智慧法院等领域。从业以来先后负责过云南全省法院信息化建设、全国法院执行系统建设、“206”工程等行业级项目。2019年加入数澜科技,负责数字检务产品线,形成以“数据服务业务,业务产生价值”为核心的数字化建设方法论,切实解决业务场景痛点。
目錄 :
序一
序二
前言
由来篇 因何产生,为何需要
第1章 因:6大数据困局
1.1 数据孤岛,无法打通2
1.2 烟囱式建设,重复造轮子6
1.3 各说各话,没有统一口径9
1.4 鸡同鸭讲,无法穿透业务层12
1.5 数据人员的梦魇,数据治理永远没有尽头14
1.6 数据部门的尴尬,被命运扼住咽喉的成本中心18
第2章 源:6段由来过程
2.1 数据资产发展的4个阶段22
2.1.1 数据资产1.0:构建消费者信息库23
2.1.2 数据资产2.0:ID-Mapping打通数据27
2.1.3 数据资产3.0:全集团数据共享共荣30
2.1.4 数据资产4.0:更广泛领域的数据实践35
2.2 方法论抽象的2个阶段38
2.2.1 方法论0.1:方法梳理38
2.2.2 方法论1.0:原理研究42
2.3 标签在数据系统中的定位45
2.3.1 标签在数据资产中的位置45
2.3.2 标签在数据中台中的位置50
2.4 关键术语的定义和解释54
第3章 义:3点产生必要
3.1 数据资产可复用59
3.2 面向业务可理解64
3.3 数据价值可衡量69
理论篇 基础原理与演绎推导
第4章 道:4个核心原理
4.1 为什么要先讲道76
4.1.1 思维认知之重77
4.1.2 什么是道78
4.2 业务与数据的连接发展80
4.2.1 数据系统的发展历程80
4.2.2 业务系统与数据系统的关联 81
4.2.3 面向业务的数据资产组织形式83
4.3 根、枝干、叶/花83
4.3.1 树的根决定了这是一棵什么树84
4.3.2 树的枝干对应标签分类84
4.3.3 树的叶/花部分指向标签85
4.4 能量、养分和凋零91
4.4.1 实体树之间通过关系树连接92
4.4.2 从实体树叶子回溯打开关系树森林93
4.4.3 关系树向实体树赋予能量94
4.4.4 业务使用是对标签树的养分供给96
4.4.5 最终梳理出一片森林而非一棵树97
4.5 分形结构与资产树栽种模式97
4.5.1 完整规划,由浅入深99
4.5.2 纵深打穿,从局部直接截取101
4.6 资产树使用模式推演103
4.6.1 查询服务105
4.6.2 分析服务106
4.6.3 圈选服务108
第5章 法:完整的设计方法
5.1 3个构建前提110
5.1.1 统一的数据思维111
5.1.2 充分的前期调研115
5.1.3 正确的落地思路120
5.2 6个设计步骤123
5.2.1 识别对象123
5.2.2 同一对象数据打通125
5.2.3 数据化的事物表达130
5.2.4 构建数据类目体系133
5.2.5 构建标签类目体系138
5.2.6 前后台标签类目体系168
第6章 术:使用技法与重要问题
6.1 标签规范177
6.1.1 标签化178
6.1.2 元标签180
6.1.3 标签问题191
6.2 谈谈组合标签195
6.2.1 同一对象下的标签组合195
6.2.2 不同对象间的标签组合200
6.3 如何使用标签208
6.3.1 什么是平台级复用208
6.3.2 平台级复用的标签使用方式209
6.3.3 什么是服务组件、数据服务、数据应用系统210
6.3.4 服务组件的演变趋势214
6.4 标签怎么运营217
6.4.1 标签的全生命周期运营217
6.4.2 标签运营环节中的责任单位220
6.4.3 标签的运营闭环221
6.5 标签质量怎么看222
6.5.1 数据来源类相关指标222
6.5.2 标签加工过程相关指标223
6.5.3 标签使用过程相关指标224
6.6 标签成本怎么看224
6.6.1 标签数据源采集与存储成本225
6.6.2 标签设计与加工成本227
6.6.3 标签使用与营销成本228
6.7 标签价值怎么看229
6.7.1 标签价值的分类229
6.7.2 标签价值的衡量方式232
6.8 标签方法论与数仓建模的异同233
6.8.1 标签方法论与数仓建模的差异234
6.8.2 标签方法论与数仓建模的联系235
实践篇 商业实战中的价值涌现
第7章 器:标签工具和经典模板
7.1 标签工具238
7.1.1 标签体系设计239
7.1.2 标签同步与加工243
7.1.3 标签管理244
7.1.4 标签门户247
7.1.5 标签使用250
7.2 4个经典模板253
7.2.1 用户标签类目体系模板254
7.2.2 企业标签类目体系模板268
7.2.3 员工标签类目体系模板277
7.2.4 商品标签类目体系模板291
第8章 践:从标签到应用的5个最佳实践
8.1 实践1:银行业卡业务精准营销场景300
8.1.1 银行业卡业务标签设计301
8.1.2 银行业卡业务标签应用308
8.1.3 银行业卡业务实践小结310
8.2 实践2:汽车业整车厂商可视化大屏场景311
8.2.1 汽车业整车厂商标签设计312
8.2.2 汽车业整车厂商标签应用319
8.2.3 汽车业整车厂商实践小结323
8.3 实践3:制造业B2B平台供应链金融场景324
8.3.1 制造业B2B平台标签设计325
8.3.2 制造业B2B平台标签应用333
8.3.3 制造业B2B平台实践小结337
8.4 实践4:零售业电商千人千面推荐场景339
8.4.1 零售业电商标签设计340
8.4.2 零售业电商标签应用345
8.4.3 零售业电商实践小结347
8.5 实践5:地产业物管效能分析场景348
8.5.1 地产业物管标签设计349
8.5.2 地产业物管标签应用356
8.5.3 地产业物管实践小结358
第9章 果:价值、案例、经验分享
9.1 7点价值总结359
9.1.1 串联360
9.1.2 业务友好361
9.1.3 全息刻画362
9.1.4 可复用363
9.1.5 可管理364
9.1.6 可运营365
9.1.7 创新场景366
9.2 4个典型案例368
9.2.1 阿里巴巴集团典型案例368
9.2.2 时尚集团典型案例371
9.2.3 好莱客家居典型案例375
9.2.4 温州检察院典型案例380
9.3 3点培养经验385
9.3.1 深入业务385
9.3.2 胆大心细388
9.3.3 工匠精神391
內容試閱 :
“用”数据而非“管”数据
当前很多企业在搭建数据中台时,仍然采用传统的管理思路:要梳理哪些数据,需要多少台服务器来存储数据,要采购什么计算引擎……其构建思路依然是:搭建开发集成环境进行一站式开发,利用数据管理工具对数据标准、数据安全、元数据进行管理,利用API网关对所有服务接口进行调用监控……
这些事情本身并没有错,但以技术来驱动数据中台建设也许从方向上就错了!技术专家给客户看的架构图越来越复杂,乙方企业在争抢技术领先的泥沼中越陷越深,甲方客户则看得晕头转向。
中台的核心本质是将可复用的能力、技术和工具汇聚在一起,帮助前端业务快速响应变化。中台从定义上就超出了技术范畴,它所涉及的系统领域并不局限于技术层面。
中台必须与业务接轨,不能与业务无缝接轨的不能叫中台。好的中台能让业务小组或创新小组基于中台已有的可复用模块快速优化业务功能,创新商业模式。而这种中台的建设不能再以“管”数据的思路为指导,而要以“用”数据为出发点。
现在的中台还停留在1.0时代,即供技术人员开发和管理数据使用;到了2.0时代,中台应该是一个智能操作系统,能让业务人员以可理解、易操作的方式创建服务接口或应用系统,让数据“用”起来。
也许我们应该花更多精力来思考如何快速进入中台2.0时代。
现状是,很多企业还停留在数据梳理、治理、数仓建设阶段,业内研究较多的仍然是如何制定标准、推动标准治理落地。在实践过程中,数据部门把自己变成了庞大的成本中心,数据治理项目做了几年还只是刚刚开了个头,而业务部门则嗷嗷待哺,已经失去了耐心。
数据资产是什么?数据中台的价值是什么?在繁杂的工作面前,我们需要回归事物的本质。数据资产是能给业务带来经济价值的数据资源。数据中台的价值在于让业务快速试错,在千百次的试验中找到并发挥数据的商业价值。因此比起开发、治理和管理,是不是更应该将注意力放在寻找真正能给业务带来价值的数据资源上?在本书中我们用标签—一种从业务视角理解数据的组织方式—作为数据资产的逻辑载体。有了标签对物理数据的逻辑映射,数据对于业务人员来说就不再是无法碰触的数据虚体,而是鲜活生动的数据产品,具有标签名、标签定义、标签逻辑、标签取值、标签适用场景、标签调用量、标签质量、标签价值等使用属性。标签化使得业务人员看数据就像逛淘宝,选数据就像加购物车,用数据就像下单购买一样简单。
这时候,一种岗位应运而生。这种岗位以前可能叫数据产品经理,现在应该叫数据资产设计师,而以后一定是数据资产使能者:专心研究业务所需标签,将其设计和开发出来并在数据中台的数据资产库中上架,让业务人员能自己查看、选择、使用标签,从而极大地缩短数据资产使用周期,降低业务试错成本,通过反向推动链将数据价值发挥到极致。
本书主要内容
本书共9章,分为3篇。
由来篇(第1~3章) 首先分析了当前各企业在数据建设过程中会遇到的6大数据困局,然后重点介绍了为应对这些数据困局而逐渐发展出的标签类目体系这一数据资产构建方法论及其定位、定义,最后阐述了采用该方法建设数据资产的3点必要性:资产可复用、业务可理解、价值可衡量。
理论篇(第4~6章) 详细讲解了标签类目体系方法论的4个核心原理、从核心原理衍生出的3个构建前提和6个设计步骤,以及标签方法论在实施落地过程中的具体使用技法与核心问题。
实践篇(第7~9章) 重点介绍了当前可用来提升标签类目体系的设计、使用、运营效率的标签工具和经典模板,列举了从标签到应用的5个最佳实践方案,并总结了标签化的价值、典型应用案例及标签设计人才的培养经验。
读者对象
企业管理者:CEO、CIO、CTO、CDO、数字化转型项目领导者、数据中台构建项目领导者等。
数据从业人员:数据部门主管、数据架构师、数据产品经理、数据分析师、数据开发工程师等。
业务人员:业务部门负责人、业务人员、运营人员等。
致谢
本书有两大写作目的:一是我们想将标签类目体系的构建过程和经验汇编成册,二是我们公司希望将优秀的数据资产设计方法沉淀下来,同时对外与所有正处于数字化转型过程中的企业客户分享,输出并传播数据资产的前沿理念和方法。因此感谢数澜科技市场营销部门、交付部门、研发部门、总裁办等各部门的支持与配合。感谢甘云锋、高雁冰两位领导为本书提供建议与指导。
本书内容来自我们多年以来的数据项目实践,特别是最近几年面向企业端的数据中台建设经历。因此我们要感谢所有给予标签类目体系成长和实践机会的合作伙伴,特别感谢时尚集团、好莱客创意家居、温州检察院等企业、政府机构对标签类目体系方法论的认可及对我们工作的配合。感谢刘容、郭新和、倪建海等专家对实践篇的修改与指正。
感谢曾蓓、王尹等同事及杨福川、罗词亮两位编辑对书稿的编辑与优化。
最后,也是最重要的,感谢一直陪伴在我们身边的家人,是他们的理解和牺牲让我们能够全力以赴地奋战在数据第一线,积累起丰富的数据实践经验,并得以写下这本理论结合实际的著作。
希望我们的数据梦想能和各位分享。
序 一
将数据进行标签化的思路就像微积分。微积分是两个概念的组合,先微分,再积分。微分是把一个大的东西切分成足够微小的部分;积分是把切分后的微小部分组织合成。标签的设计过程就是把各种对象充分“微分”的过程,解析和拆分得足够精细;而标签的使用过程就是将场景中涉及的对象标签拼装在一起使用,是一个“积分”的过程。
通过微积分的比喻,我们可以更好地理解“传统数据处理过程”和“标签化数据处理过程”的显著差异。
传统的数据处理往往是业务到数据再回到业务的快速贯通。
将业务端新鲜产生的源数据传到数据工厂中进行清洗处理,再快速将生产好的数据直接透传到业务端进行使用分析(见图1)。整条链路就像生产流水线一样快速、简洁、干脆。但是在同一份数据的跨业务领域使用或跨时间先后使用的场景中,经常存在复用困难的问题。
标签化的数据处理则意味着数据需要经过标准化组织后规模复用。
源数据经过清洗、加工、处理后,并不能直接搭载飞机直达业务现场,而是全部规规矩矩地到数据资产仓库的格子间验明正身、对号入座(见图2)。业务端要使用数据,必须拿着提货单到资产仓库一一挑选,检验后的标签资产会像搭载高铁般准时到达业务现场。这种模式很明显,由于增加了中间数据资产的管理环节,整体建设花费的时间较长,即“砍柴”前需要等待较长的“磨刀工”。
图1 传统数据处理过程
图2 标签化数据处理过程
前一种适用于小企业对所需的数据服务产出时效有严格限制,只关注当前某一个局部的应用场景。实际上当前在很多大型集团企业中,快速完成数据开发后直接插管子、将数据灌送至业务系统的情况很普遍。
后一种实际上已经是一种中台模式了:将生产好的数据全部入库编号,并检查标签项是否完整、规范、准确。业务人员无论在何时选用资产都可以根据充分公开的标签信息自由下单,标签之间可以自由组合。这种将经常用到的信息、技术、功能进行标准化封装以供业务端不同场景复用、拼装的做法就是中台模式。中台模式适用于业务场景多样化的大型集团企业:通过一次建设、反复享用的方式可以节省成本,形成规模效益,同时还可以为企业沉淀核心的数据资产。
在实施落地数字化转型的过程中,企业会遇到理念与实际冲突的情况,也会遇到各种阻力和困惑。到底选择传统数据模式还是标签化数据模式,本质而言是效率问题和商业问题,也许“慢就是快”的长线思维和“成本降低,收入增加”的财务公式能让大家聚焦问题本质。
因此对数据资产的认知决定了一家企业从上到下会如何看待、选择数字化转型的路径。是先解决眼前问题、渡过难关,还是延迟满足,不能马上见成效的事也做?是选择赢得一时一刻绩效达标的有限游戏,还是选择不断满足用户需求、基业长青的无限游戏?
希望这本书能给大家带来思考和答案。
数澜大学 2021年5月 序 二
辛丑年春节前,我接到作者邀请并答应为本书作序。这既是一本讨论数据资产的书,也是一本讨论方法论的书,所以我想以对资产的粗浅认识谈谈对数据资产的理解,以对数字经济的认识谈谈对“数据是第五大生产要素”的理解。
数据作为资产,作为生产要素,这是一个崭新的认识,具有重要的意义。
资产的严格定义是:资产指由企业过去的交易或事项形成的、由企业拥有或控制的、预期会给企业带来经济利益的资源。对照这个定义,数据具备一些传统资产所具有的特征,例如形成方式、资源属性,但在拥有权、交换性、货币化等方面,数据具有与传统资产非常不同的特征,也就是说作为资产,数据有其独特性,需要人们站在新的、更高的视角来理解和解读。
2020年4月9日,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,首次将数据列为除土地、劳动力、资本、技术之外的第五大生产要素。这是一次重大的认知突破,必然会带来重大的影响。
讨论数据资产或数据生产要素概念时,都绕不开对“数字经济”的解读。众所周知,“数字经济”由加拿大学者唐·泰普斯科特(Don Tapscott)在其1996年的著作《数字经济: 网联智能时代的前景与风险》(The Digital Economy: Promise and Peril in the Age of Networked Intelligence)中第一次提出。
我们认为,数字经济的基本特征是,以数据资源为重要生产要素,以现代信息网络为主要载体,以信息通信技术融合应用,以全要素数字化转型为推动力,促进公平与效率更加统一。数字经济会带来重大的时代转型: 生产方式变革,生产关系再造,经济结构重组,生活方式巨变。新一轮的科技革命带动了数字经济发展,促成了当前世界的百年未有之大变局,给了新兴市场国家发展机遇,加速了全球产业链和全球治理体系的改变。
数据是数字经济时代的重要资产和生产要素,有其独特之处。
首先,数据可复制、可共享,这与只能有限供给的土地、劳动力、资本等传统生产要素非常不同。数据还可增殖,数据在用于生产的过程中会产生更多的数据。
其次,数据带来了新的人本主义。我们处在一个万物互联的时代,万物通过有线或无线的网络互联,而数据是万物互联的纽带和桥梁。大数据的“大”不是简单地指数量大,更重要的是讲跨度之大,起纽带和桥梁的作用。“万物互联”还有一个很重要的言外之意是,人是万物之灵。数据是人对世界万物认识的一个表示,数据是为了人的(Data about Human, Data for Human),我们有必要深刻理解这种新的人本主义。
最后,数据带来了新的伦理和法律问题。在大数据和人工智能时代,隐私保护和信息安全成为公众关心的重要话题。数据成为资产,升级为第五大生产要素,对传统的伦理和法律体系提出了极大的挑战,需要我们认真思考和深入研究,并及时进行技术攻关,给出解决方案,回应各方关切。
“Data is Power”,这是我近十年以来秉持的一个基本信念,也是驱使我坚持办数据学院的根本动机。数据是人类文明史上的第三种重要能源(Power),前两种能源分别是蒸汽能(Steam Power)和电能(Electric Power),它们分别引发了第一次和第二次工业革命。如果说蒸汽能和电能造就了从英国开始的近三百年的工业文明,那么数据能(Data Power)则将把人类带入数字文明时代。随着人们对数据认识的提高,我们正在快速进入一个“未来已来,一切重构”的时代。
如果要给数据找一个恰当的比拟物,也许19世纪末伟大的发明交流电是最合适的。当前我们所处的时代就像一百多年前刚刚有了交流电一样,不仅需要研究发电机和电动机,更需要研究电本身,如电的变压原理、电的传输,还要研究电的绝缘、继电保护和电网建设,等等。对于数据,类似这一切的研究刚刚起步,数据中台就是一个很好的理念。在我看来,数据中台包含两层含义:第一层是打通数据,就像建电网;第二层是让数据好用,就是把数据技术装备化,甚至“傻瓜化”,让所有业务人员都可以轻松自如地使用数据,发挥“数据能”的威力。换句话说,数据中台的目的就是帮助企业提高数据能力。
本书是作者和同事在帮助企业进行数据能力建设过程中的经验总结。这是难能可贵的,也是我很看重和欣赏的。很长一段时间以来,我们的企业往往只看重怎么解决问题,缺少总结和反思。用我常用的比喻来说,就像猴子掰苞谷,掰一个扔一个。没有积累,就不会有沉淀,也就形成不了技术体系和学术概念,注定不会有创新。这本书让我看到了一家企业的学术情怀:善于总结,甘于传播和布道。
因为有梦,所以出发;既已出发,使命必达。与作者共勉。
周傲英 华东师范大学副校长