新書推薦:
《
青铜之美 国宝里的中式美学
》
售價:HK$
177.0
《
海外中国研究·朱熹的思维世界(增订版)
》
售價:HK$
143.4
《
甲骨文丛书·沙漠之王:英美在中东的霸权之争
》
售價:HK$
110.9
《
汗青堂丛书147·光明时代:中世纪新史
》
售價:HK$
85.1
《
能成事的团队
》
售價:HK$
111.9
《
现代无人机鉴赏(珍藏版)
》
售價:HK$
78.2
《
汗青堂丛书·晚清风云(4册套装):帝国的切口 清朝与中华传统文化 太平天国运动史 冲击与回应
》
售價:HK$
427.8
《
穿在身上的历史:世界服饰图鉴(增订珍藏版)
》
售價:HK$
557.8
|
編輯推薦: |
(1)中国科学院院士普林斯顿大学教授北京大数据研究院院长鄂维南等专家推荐(2)作者是金融技术和业务领域的双栖专家,技术方面,致力于机器学习和智能风控算法的研究与应用多年;业务方面,参与过上百亿信贷资产的管理,为超过30家金融机构搭建风险运营SaaS平台,主持过多家银行的本地化风控体系建设项目。(3)多年来,作者一直在国内头部的互联网公司的金融部门和国际化资产管理集团就职(因为敏感,所以不方便透露公司名称),积累了丰富的经验。(4)系统讲解了智能风控和反欺诈在信贷风控领域实践全流程,从业务和技术双维度讲解传统风控体系与智能风控算法和模型的结合使用。
|
內容簡介: |
内容介绍
这是一部指导信贷业务如何用智能风控、反欺诈的技术和方法实现风险控制的著作。
作者是经验丰富的智能风控算法专家,先后就职于头部的互联网公司的金融部门以及头部的公募基金公司,致力于人工智能算法在信贷风控领域的应用。
本书不仅体系化地讲解了智能风控和反欺诈的体系、算法、模型以及它们在信贷风控领域实践的全流程,而且还从业务和技术两个角度讲解了传统的金融风控体系如何与智能风控方法实现双剑合璧。全书以实战为导向,辅以多个用Python实现的综合案例,便于读者理解和实操。
全书共10章,逻辑上分为四个部分:
第1~3章是风控业务的基础,首先介绍了什么是信用风险和欺诈风险,然后讲解了传统风险管理体系中搭建评分卡的思路,以及智能风控时代数据和模型的技术框架。
第4~6章集中讲述了智能风控中常见的特征工程、算法原理和建模流程,包括梯度提升决策树、孤立森林、神经网络、词嵌入、图嵌入等前沿算法的数学原理和公式。
第7~9章是作者参与过的风控和反欺诈实战项目,通过案例和代码的形式,帮助读者更好地将风控理念和建模技术融会贯通。内容介绍
这是一部指导信贷业务如何用智能风控、反欺诈的技术和方法实现风险控制的著作。
作者是经验丰富的智能风控算法专家,先后就职于头部的互联网公司的金融部门以及头部的公募基金公司,致力于人工智能算法在信贷风控领域的应用。
本书不仅体系化地讲解了智能风控和反欺诈的体系、算法、模型以及它们在信贷风控领域实践的全流程,而且还从业务和技术两个角度讲解了传统的金融风控体系如何与智能风控方法实现双剑合璧。全书以实战为导向,辅以多个用Python实现的综合案例,便于读者理解和实操。
全书共10章,逻辑上分为四个部分:
第1~3章是风控业务的基础,首先介绍了什么是信用风险和欺诈风险,然后讲解了传统风险管理体系中搭建评分卡的思路,以及智能风控时代数据和模型的技术框架。
第4~6章集中讲述了智能风控中常见的特征工程、算法原理和建模流程,包括梯度提升决策树、孤立森林、神经网络、词嵌入、图嵌入等前沿算法的数学原理和公式。
第7~9章是作者参与过的风控和反欺诈实战项目,通过案例和代码的形式,帮助读者更好地将风控理念和建模技术融会贯通。
?第10章以金融科技行业的头部玩家为例,展望了智能风控和反欺诈技术未来的商业模式和发展方向。
|
關於作者: |
作者介绍
蔡主希
研究生毕业于哥伦比亚大学统计专业,资深智能风控算法专家。
现就职于某具有全牌照业务的综合性国际化资产管理集团,负责人工智能算法在金融科技领域的研究和落地。曾任两家头部互联网公司金融部门风控算法专家,以及北京大数据研究院金融研究员。
是国内大数据风控领域的先驱者,致力于机器学习和人工智能算法在信贷风控领域的应用,参与过上百亿信贷资产的管理,为超过30家金融机构搭建风险运营SaaS平台,主持过多家银行的本地化风控体系建设项目。
|
目錄:
|
推荐序
前 言
第1章 互联网金融与风险管理1
1.1 互联网金融的发展和现状1
1.2 风险管理类型划分2
1.2.1 欺诈风险4
1.2.2 信用风险6
1.3 风险管理的重要性10
1.3.1 风险评估10
1.3.2 差异化定价12
1.3.3 整体利润最优13
1.4 本章小结14
第2章 传统风险管理体系15
2.1 人工审核15
2.1.1 纸质材料评估16
2.1.2 电话回访16
2.1.3 线下走访尽调17
2.2 专家模型17
2.2.1 业务规则库17
2.2.2 专家调查权重法18
2.2.3 熵权法19
2.3 评分卡模型21
2.3.1 目标定义21
2.3.2 样本选取23
2.3.3 变量分箱24
2.3.4 变量筛选24
2.3.5 模型建立29
2.3.6 模型评估30
2.3.7 模型应用33
2.4 传统方法的问题和挑战34
2.5 本章小结35
第3章 智能风控模型体系36
3.1 大数据平台36
3.1.1 原始数据清洗37
3.1.2 数据仓库管理37
3.1.3 数据标签应用38
3.2 决策引擎38
3.2.1 规则配置39
3.2.2 模型部署40
3.2.3 冠军挑战者41
3.2.4 版本和权限管理42
3.3 智能反欺诈模型42
3.3.1 无监督学习43
3.3.2 图计算44
3.4 智能信用风险模型45
3.4.1 专家模型45
3.4.2 逻辑回归46
3.4.3 决策树46
3.4.4 集成树47
3.4.5 深度神经网络47
3.4.6 循环神经网络48
3.5 智能模型带来的提升48
3.5.1 数据广度和深度48
3.5.2 模型快速迭代和主动学习49
3.5.3 线上自动决策49
3.6 统计学与机器学习49
3.7 本章小结50
第4章 风控大数据体系51
4.1 数据源类型51
4.1.1 征信报告52
4.1.2 消费能力54
4.1.3 资产状况54
4.1.4 基本信息54
4.1.5 黑名单55
4.1.6 多头借贷55
4.1.7 运营商56
4.1.8 地理位置56
4.1.9 设备属性57
4.1.10 操作行为57
4.2 特征工程方法57
4.2.1 统计量58
4.2.2 离散化58
4.2.3 时间周期趋势59
4.2.4 交叉项59
4.2.5 隐性特征60
4.2.6 用户画像61
4.3 数据测试与应用61
4.3.1 联合建模机制61
4.3.2 数据质量评估62
4.3.3 线上应用63
4.4 数据安全合规63
4.5 本章小结64
第5章 智能风控中的常用算法68
5.1 有监督学习68
5.1.1 逻辑回归69
5.1.2 决策树70
5.1.3 随机森林73
5.1.4 梯度提升决策树74
5.2 无监督学习76
5.2.1 聚类76
5.2.2 孤立森林79
5.3 深度学习80
5.3.1 深度神经网络80
5.3.2 循环神经网络83
5.3.3 词嵌入86
5.3.4 自编码器88
5.3.5 迁移学习89
5.4 图计算91
5.4.1 社区发现91
5.4.2 标签传播92
5.4.3 图嵌入93
5.5 强化学习97
5.6 本章小结99
第6章 智能模型训练流程101
6.1 数据清洗101
6.1.1 缺失值处理102
6.1.2 异常值处理103
6.1.3 重复值处理105
6.1.4 一致性检验105
6.1.5 有效性检验106
6.2 特征工程和特征筛选107
6.2.1 探索性数据分析107
6.2.2 稳定性108
6.2.3 重要性109
6.2.4 相关性110
6.2.5 解释性111
6.3 模型训练111
6.4 模型部署114
6.5 监控预警114
6.6 本章小结119
第7章 反欺诈案例120
7.1 案例背景120
7.2 原始数据介绍120
7.3 探索性数据分析121
7.3.1 交易笔数121
7.3.2 交易时间122
7.3.3 交易类型123
7.3.4 交易IP地址124
7.4 特征工程124
7.4.1 特征加工124
7.4.2 特征筛选130
7.4.3 特征分组130
7.5 模型训练131
7.6 模型评估134
7.7 案例优化136
7.8 本章小结137
第8章 个人信贷风控案例138
8.1 案例背景138
8.2 原始数据介绍139
8.3 特征工程139
8.4 探索性数据分析142
8.5 模型训练144
8.5.1 逻辑回归144
8.5.2 XGBoost150
8.5.3 Wide&Deep158
8.6 模型评估162
8.7 模型应用168
8.8 案例优化169
8.9 本章小结170
第9章 企业信贷风控案例171
9.1 银行POS贷171
9.1.1 案例背景171
9.1.2 原始数据介绍172
9.1.3 特征工程173
9.1.4 模型训练173
9.1.5 模型应用176
9.2 汽车金融CP评级178
9.2.1 案例背景178
9.2.2 原始数据&特征工程179
9.2.3 模型训练179
9.2.4 模型评估181
9.3 案例优化182
9.4 本章小结183
第10章 智能风控能力对外输出184
10.1 对外输出的意义184
10.1.1 内部能力走出去185
10.1.2 外部资源引进来185
10.2 头部玩家介绍186
10.2.1 互联网公司186
10.2.2 银行科技子公司189
10.2.3 第三方技术提供商190
10.3 合作模式及案例191
10.3.1 SaaS 本地化模式192
10.3.2 对外输出案例193
10.4 金融科技创新与监管195
10.5 本章小结197
|
內容試閱:
|
为何写作本书
互联网金融是中国金融行业数字化升级的产物。2020年监管部门出台了一系列举措,标志着这个行业从成长期正式步入成熟期。互联网金融机构的快速发展离不开依托于大数据和机器学习的风控及反欺诈能力,这些风险管理能力帮助机构在过去十年通过信贷业务赚取了利润,也是未来十年各机构开展金融科技业务的核心竞争力。
笔者有幸于毕业后进入互联网金融行业,在北京大数据研究院和头部互联网公司有过丰富的项目经验,与传统金融机构的业务人员也有过较多接触。在实际工作及与同行交流的过程中,笔者发现这个行业内还是存在一些信息不对称的问题:传统金融机构(包括银行、消费金融公司、信托等)的业务人员仍然习惯于接受传统评分卡那一套风控理念,对于黑箱的机器学习模型存在较多质疑;而互联网公司的建模人员往往过于注重算法的性能优化,却忽略了其与线上风控策略和信贷场景的结合。笔者也调研了市面上与风控相关的图书,多数图书专注于评分卡或者智能风控的单一方面,缺乏将两者有机结合的资料,这使得刚入行的新人很难对整个行业有一个完整的认知。与此同时,业务人员和技术人员对风控的理解也存在鸿沟。
笔者撰写本书,一方面是想降低整个信贷风控行业的门槛,帮助更多对此感兴趣的学生快速了解并加入这个行业;另一方面是想帮助各大公司的业务人员和技术人员拉齐彼此对于风控的认知,提高合作效率,促进整个金融行业的科技化转型。当然,笔者并不鼓励读者去互联网平台借贷,希望读者可以提高风险意识,谨慎操作,远离不法贷款平台。
本书读者对象
本书主要面向信贷风控行业的广大业务人员、策略分析师、数据分析师、算法工程师以及对互联网金融和智能风控、反欺诈感兴趣的读者。
如何阅读本书
本书集合了目前互联网金融行业风控方面的业务和技术内容,辅以项目案例和代码实现,力求帮助读者通过一本书了解智能风控和反欺诈技术的全貌。
第1~3章涵盖风控业务的基础知识,主要介绍了什么是信用风险和欺诈风险,传统风险管理体系中搭建评分卡的思路,以及智能风控时代下大数据平台、决策引擎和智能模型的技术框架。这一部分普及了风控中的一些常见术语,可帮助技术人员更深入地了解风控决策的整个过程。对传统金融机构风险管理体系感兴趣的读者,可以进一步阅读业界大咖陈建老师、乔杨老师的书。
第4~6章介绍智能风控模型中常见的数据源和算法,其中数学原理和公式较多,适合想了解更多模型知识的业务人员以及想从事建模工作的读者。由于篇幅有限,笔者只选取了与风控和反欺诈场景相关的算法,很多公式的推导和求解过程并没有详细展开。想了解更多机器学习和深度学习算法的读者,可以进一步学习周志华老师、李航老师以及Ian Goodfellow等人的著作。
第7~9章讲解笔者参与过的风控和反欺诈的实战项目,希望帮助读者通过实际案例更好地将风控理念和建模技术融会贯通,缺乏项目经验的读者可以重点关注这部分内容。如果还想了解更多风控算法的Python代码实现,可以关注梅子行老师的书。
第10章是行业内金融科技的头部玩家解析和案例介绍,可帮助读者初步了解智能风控和反欺诈在未来十年的应用方向。金融科技目前在国内仍然处于探索阶段,市面上还没有系统介绍这方面知识的图书,感兴趣的读者可以关注相关头部公司或者权威媒体的宣传账号,紧跟行业动向。
资源与勘误
笔者在写作过程中参考了市面上已有的许多图书、论文和权威媒体文章,力争书中的每一处内容都是有据可循的。但由于笔者水平有限,书中难免会存在一些错误和疏漏,欢迎各位读者和专家批评指正。如果有任何关于本书的意见或建议,欢迎发送邮件到yfc@hzbook.com。
致谢
首先感谢机械工业出版社华章公司的杨福川老师和朱巍老师,以及其他为本书出版做出贡献的工作人员。没有各位的耐心解答和专业指导,我一定没有办法顺利完成这本书的写作工作。
其次感谢北京大数据研究院、京东数科、滴滴金融(按照入职时间顺序)以及其他合作公司的领导和同事。本书中的很多风控理念和建模思想,都源自与业内各位专家的交流,感谢同人们为中国金融行业数字化升级做出的贡献。
最后要感谢我新婚的妻子陪伴我度过无数个码字的午夜和周末,默默地支持我完成整本书的创作。在繁忙的工作之余还要利用休息时间写书是一件很困难的事情,有她的鼓励我才得以坚持下来。
|
|