新書推薦:
《
场景供应链金融:将风口变成蓝海
》
售價:HK$
111.8
《
汗青堂丛书146·布鲁克王朝:一个英国家族在东南亚的百年统治
》
售價:HK$
91.8
《
人生是旷野啊
》
售價:HK$
72.8
《
甲骨文丛书· “安国之道”:英国的殖民情报系统及其在亚洲的扩张
》
售價:HK$
88.5
《
台北人(2024版)
》
售價:HK$
87.4
《
让孩子更有力量:赋权型家庭教育指南
》
售價:HK$
67.0
《
白夜追凶(上下)
》
售價:HK$
109.8
《
财富、战争与智慧——二战股市风云录
》
售價:HK$
132.2
|
編輯推薦: |
本书简单实用,书中配备大量的图表说明,特点如下。
IT零起点:无须任何电脑编程基础,只要会打字、会使用Excel,就能看懂本书。
投资零起点:无须购买任何专业软件,配套zwPython 软件包。
配置零起点:所有软件、数据全部采用 开箱即用模式,解压缩即后可直接运行。
理财零起点:采用通俗易懂的语言,配合大量专业的图表和实盘操作案例。
数学零起点:全书没有复杂的数学公式,轻轻松松就能看懂全书。
|
內容簡介: |
本书采用生动活泼的语言,从入门者的角度,讲解了Python 语言和sklearn 模块库内置的各种经典机器学习算法;介绍了股市外汇、比特币等实盘交易数据在金融量化方面的具体分析与应用,包括对未来股票价格的预测、大盘指数趋势分析等。简单风趣的实际案例让广大读者能够快速掌握机器学习在量化分析方面的编程,为进一步学习金融科技奠定扎实的基础。
|
關於作者: |
何海群,网名:字王,CHRD前海智库CTO,《中华大字库》发明人,20年人工智能从业经验;zwPython开发平台、TopQuant.vip极宽量化系统设计师,中国Python创客项目发起人,国内Python量化项目的启蒙者和开拓者:《Python量化实盘魔鬼训练营》,TOP极宽量化开源团队的创始人。研究成果有:BigQuant理论架构:Python量化 数字货币 人工智能;小数据理论,GPU超算工作站、MTRD多节点超算集群算法、1 N网络传播模型、人工智能足彩图灵法则等;论文《人工智能与中文字型设计》是中文字库行业三大基础建模理论之一。
|
目錄:
|
目 录
第1 章 Python 与机器学习...... 1
1.1 scikit-learn 模块库........ 2
1.1.1 scikit-learn 的缺点. 3
1.1.2 scikit-learn 算法模块......... 4
1.1.3 scikit-learn 六大功能......... 5
1.2 开发环境搭建...... 8
1.2.1 AI 领域的标准编程语言:Python 8
1.2.2 zwPython:难度降低90%,性能提高10 倍.. 9
1.2.3 零对象编程模式........ 11
1.2.4 开发平台搭建...... 12
1.2.5 程序目录结构...... 12
案例1-1:重点模块版本测试.... 13
1.3 机器学习:从忘却开始....... 17
1.4 学习路线图........ 20
第2 章 机器学习编程入门..... 21
2.1 经典机器学习算法..... 21
2.2 经典爱丽丝........ 22
案例2-1:经典爱丽丝.... 24
案例2-2:爱丽丝进化与文本矢量化.. 26
2.3 机器学习算法流程..... 28
2.4 机器学习数据集......... 28
案例2-3:爱丽丝分解.... 29
2.5 数据切割函数.... 33
2.6 线性回归算法.... 34
案例2-4:爱丽丝回归.... 35
第3 章 金融数据的预处理..... 40
3.1 至简归一法........ 40
案例3-1:麻烦的外汇数据........ 41
案例3-2:尴尬的日元.... 45
案例3-3:凶残的比特币 49
3.2 股票池与Rebase......... 51
3.2.1 股票池........ 51
3.2.2 Rebase 与归一化.. 52
案例3-4:股票池Rebase 归一化........ 53
3.3 金融数据切割.... 57
案例3-5:当上证遇到机器学习 58
3.4 preprocessing 模块..... 63
案例3-6:比特币与标准化........ 65
案例3-7:比特币与归一化........ 69
第4 章 机器学习快速入门..... 72
4.1 回归算法. 72
4.2 LR 线性回归模型....... 73
案例4-1:上证指数之LR 回归事件... 76
4.3 常用评测指标.... 81
4.4 多项式回归........ 83
案例4-2:上证指数的多项式故事...... 83
案例4-3:预测比特币价格........ 86
4.5 逻辑回归算法模型..... 87
案例4-4:上证指数预测逻辑回归版.. 88
第5 章 模型验证优化..... 96
5.1 交叉验证评估器......... 96
案例5-1:交叉验证........ 98
5.2 交叉验证评分.. 101
案例5-2:交叉验证评分 101
第6 章 决策树.... 103
6.1 决策树算法...... 103
6.1.1 ID3 算法与C4.5 算法... 105
6.1.2 常用决策树算法 106
6.1.3 sklearn 内置决策树算法 107
6.2 决策树回归函数....... 109
案例6-1:决策树回归算法...... 110
6.3 决策树分类函数....... 115
案例6-2:决策树分类算法...... 116
6.4 GBDT 算法...... 121
6.5 迭代决策树函数....... 122
案例6-3:GBDT 回归算法...... 123
案例6-4:GBDT 分类算法...... 128
第7 章 随机森林算法和极端随机树算法 133
7.1 随机森林函数.. 135
7.2 决策树测试框架....... 137
案例7-1:RF 回归算法大测试 138
7.3 决策树测试函数....... 140
案例7-2:上证的RF 回归频道......... 142
案例7-3:当比特币碰到RF 回归算法......... 146
案例7-4:上证和RF 分类算法......... 147
7.4 极端随机树算法....... 150
7.5 极端随机树函数....... 151
案例7-5:极端随机树回归算法........ 152
案例7-6:上证指数案例应用.. 154
案例7-7:ET、比特币,谁更极端... 155
第8 章 机器学习算法模式... 159
8.1 学习模式. 161
8.2 机器学习五大流派... 164
8.3 经典机器学习算法... 165
8.4 小结........ 166
第9 章 概率编程 167
9.1 朴素贝叶斯的上证之旅..... 168
案例9-1:上证朴素贝叶斯算法........ 170
9.2 隐马尔可夫模型....... 175
案例9-2:HMM 模型与模型保存..... 176
案例9-3:HMM 算法与模型读取..... 180
第10 章 实例算法......... 185
K 最近邻算法 186
案例10-1:第一次惊喜KNN 算法......... 187
案例10-2:KNN 分类.. 190
第11 章 正则化算法..... 192
11.1 岭回归算法.... 193
案例11-1:新高度岭回归算法... 195
11.2 套索回归算法 197
案例11-2:套索回归算法应用 199
11.3 弹性网络算法 201
案例11-3:弹性网络算法应用 202
11.4 最小角回归算法..... 204
案例11-4:LARS 算法应用..... 204
第12 章 聚类分析......... 206
12.1 K 均值算法.... 207
案例12-1:K 均值算法应用.... 208
12.2 BIRCH 算法... 210
案例12-2:BIRCH 算法应用... 211
12.3 小结...... 213
第13 章 降维算法......... 215
13.1 主成分分析.... 216
案例13-1:主成分分析的应用 218
案例13-2:PCA 算法的上证戏法..... 223
13.2 奇异值分解算法..... 227
案例13-3:奇异果传说:SVD 228
第14 章 集成算法......... 229
14.1 sklearn 内置集成算法....... 231
14.2 装袋算法......... 232
案例14-1:装袋回归算法........ 232
案例14-2:装袋分类算法........ 234
14.3 AdaBoost 迭代算法. 236
案例14-3:AdaBoost 迭代回归算法. 237
案例14-4:AdaBoost 迭代分类算法. 239
第15 章 支持向量机..... 242
15.1 支持向量机算法..... 242
15.2 SVM 函数接口........ 244
案例15-1:SVM 回归算法...... 245
案例15-2:SVM 分类算法...... 247
第16 章 人工神经网络算法. 250
16.1 多层感知器.... 252
案例16-1:多层感知器回归算法...... 253
案例16-2:多层感知器分类算法...... 256
附录A sklearn 常用模块和函数..... 259
附录B 量化分析常用指标.... 284
|
內容試閱:
|
前 言
本书特色
本书全程采用黑箱模式和MBA 案例模式,结合大量经典案例,介绍sklearn 机器学习模块库和常用的机器学习算法,懂Excel 就能看懂本书;逆向式课件模式,结合大量案例、图表,层层剖析;三位一体的课件模式:图书 开发平台 成套的教学案例,系统讲解、逐步深入。
本书是《零起点Python 机器学习快速入门》的后续之作,为了节省篇幅,省略了Python 基础教程,以及sklearn 等机器学习方面的入门内容,没有经验的读者,建议先阅读《零起点Python 机器学习快速入门》,再阅读本书,这样会收到事半功倍的效果。
本书简单实用,书中配备大量的图表说明,本书特点如下。
IT 零起点:无须任何电脑编程基础,只要会打字、会使用Excel,就能看懂本书,利用本书配套的Python 软件包,轻松学会如何利用Python对股票数据进行专业分析和量化投资分析。
投资零起点:无须购买任何专业软件,本书配套的 zwPython 软件包,采用开源模式,提供100%全功能、全免费的工业级数据分析平台。
配置零起点:所有软件、数据全部采用 开箱即用模式,绿色版本,无须安装,解压缩后即可直接运行系统。
理财零起点:采用通俗易懂的语言,配合大量专业的图表和实盘操作案例,无须任何专业金融背景,轻松掌握各种量化投资策略。
数学零起点:全书没有任何复杂的数学公式,只有最基本的加、减、乘、除,轻轻松松就能看懂全书。
网络资源
本书的案例程序,已经做过优化处理,无须GPU 显卡,全部支持单CPU 平台,不过为避免版本冲突,请尽量使用zwPython2017m6 版本运行
本书的案例程序。
使用其他运行环境的读者,如Linux、Mac 平台的用户,请尽量使用Python 3 版本,自行安装其他所需的模块库,如Numpy、Pandas、Tushare等第三方模块库。
此外需要注意的是,大家运行本书案例得到的结果可能与书中略有差别;甚至多次运行同一案例,结果都有所差异。这属于正常情况,因为很多机器学习函数,内部使用了随机数作为种子数,用于系统变量初始化等操作,每次分析的起点或者中间参数会有所不同。版本冲突是开源项目常见的问题,为了解决这个问题,本书的源码是独立保存的。
此外,我们还特意设计了zwPython 教学版。建议初学者先使用zwPython 教学版,有关的课件程序,已经经过版本兼容测试,并且集成了zwDat 金融数据集。
本书的读者QQ 互动群:QQ 1 群的群号是124134140;QQ 2 群的群号是650924099;QQ 3 群的群号是450853713。资源下载地址:TopQuant 极宽量化网站资源中心。请浏览以下网站,获取最新的网络资源地址:
TopQuant.vip 极宽量化社区
ziwang.com 字王网站
目前两个网站的指向都是一样的。
另外还可以在博文视点网站下载:http:www.broadview.com.cn。
目录设置
为运行本书课件程序,用户需要下载以下三个软件,并设置好目录:zwPython,必须放在根目录,是Python 开发平台,为避免版本冲突,请尽量使用zwPython2017m6 版本。kb_demo,本书sklearn 机器学习配套课件源码。pg_demo,本书Python 入门学习配套课件源码。
以上软件、程序最好保存在固态硬盘,这样速度会快很多;目录名称不要使用中文名称,压缩文件当中的中文名称只是为了便于用户下载。zwPython 开发平台必须放在根目录,课件程序可以放在其他自定义目录,建议放在zwPython 目录下面,作为二级目录。
致谢
特别感谢电子工业出版社的黄爱萍和陈林编辑在选题策划和稿件整理方面所做的大量工作。同时,在本书创作过程中,极宽开源量化团队和培训班的全体成员提出很多宝贵的意见,并对部分课件程序做了中文注解。特别是吴娜、余勤、邢梦来、孙励、王硕几位成员,为TOP 极宽开源量化文库和开源软件编写文档,以及在团队成员管理方面做了大量工作,对他们的付出表示感谢。
何海群(字王)
TOP 极宽量化开源组发起人
2018 年10 月1 日
|
|