新書推薦:
《
场景供应链金融:将风口变成蓝海
》
售價:HK$
111.8
《
汗青堂丛书146·布鲁克王朝:一个英国家族在东南亚的百年统治
》
售價:HK$
91.8
《
人生是旷野啊
》
售價:HK$
72.8
《
甲骨文丛书· “安国之道”:英国的殖民情报系统及其在亚洲的扩张
》
售價:HK$
88.5
《
台北人(2024版)
》
售價:HK$
87.4
《
万千心理·成人情绪障碍跨诊断治疗的统一方案:应用实例
》
售價:HK$
132.2
《
让孩子更有力量:赋权型家庭教育指南
》
售價:HK$
67.0
《
白夜追凶(上下)
》
售價:HK$
109.8
|
編輯推薦: |
采用约束的概念,将当前常见的机器学习方法真正融入统一的视角,同时结合在AI社区中占主导地位的逻辑形式主义的力量。
深入探讨无监督学习和半监督学习,重点是当前的两项研究热点神经网络和核方法,对于深度学习的讨论尤其值得一读。
配有大量练习及答案,并根据Donald Knuth的难度排名进行分级,通过问题帮助读者理解知识,而不仅仅是提供烹饪菜谱。
|
內容簡介: |
本书从全新的视角诠释了机器学习的基本模型和算法,重点讨论了当前的两项研究热点神经网络和核方法。全书紧紧围绕从环境约束中学习的概念,将符号知识库作为约束集合,通过采用多值逻辑形式的思想,实现了约束方法与机器学习的深度融合。特别是对深度学习的讲解,很好地呈现了本书中所遵循的基于约束的方法。此外,本书还提供不同难度等级的练习及参考答案,适合高等院校计算机相关专业的学生参考,也适合业界研究人员和技术人员阅读。
|
關於作者: |
---作者简介---
马可戈里(Marco Gori) 意大利锡耶纳大学教授,专注于人工智能领域,特别是机器学习和游戏。他是IEEE计算智能协会意大利分会主席,意大利人工智能协会主席。此外,他还是Web Dragons: Inside the Myths of Search Engine Technology一书的作者。
---译者简介---
谢宁 电子科技大学计算机科学与工程学院副教授,四川省特聘专家。研究兴趣包括统计机器学习、计算机图形学,研究领域包括强化学习、行为智能、游戏智能、艺术化绘制等。
|
目錄:
|
译者序
前言
练习说明
第1章整体情况
11为什么机器需要学习
111学习任务
112环境的符号和子符号表示
113生物和人工神经网络
114学习的协议
115基于约束的学习
12原则和实践
121归纳的令人困惑的本质
122学习原则
123时间在学习过程中的作用
124注意力机制的聚焦
13实践经验
131度量实验的成功
132手写字符识别
133建立机器学习实验
134试验和实验备注
14机器学习面临的挑战
141学习观察
142语言理解
143生活在自己环境中的代理
15注释
第2章学习原则
21环境约束
211损失函数与风险函数
212约束引发的风险函数的病态
213风险最小化
214偏差方差困境
22统计学习
221最大似然估计
222贝叶斯推理
223贝叶斯学习
224图形模式
225频率论和贝叶斯方法
23基于信息的学习
231一个启发性的示例
232最大熵原理
233最大相互信息
24简约原则下的学习
241简约原则
242最小描述长度
243MDL与正则化
244正则化的统计解释
25注释
第3章线性阈值机
31线性机
311正规方程
312待定问题和广义逆
313岭回归
314原始表示和对偶表示
32包含阈值单元的线性机
321谓词阶数和表示性问题
322线性可分示例的最优性
323无法分离的线性可分
33统计视图
331贝叶斯决策和线性判别分析
332逻辑回归
333符合贝叶斯决策的独立原则
334统计框架中的LMS
34算法问题
341梯度下降
342随机梯度下降
343感知机算法
344复杂性问题
35注释
第4章核方法
41特征空间
411多项式预处理
412布尔富集
413不变的特征匹配
414高维空间中的线性可分性
42最大边际问题
421线性可分下的分类
422处理软约束问题
423回归
43核函数
431相似性与核技巧
432内核表征
433再生核映射
434内核类型
44正则化
441正则化的风险
442在RKHS上的正则化
443最小化正则化风险
444正则化算子
45注释
第5章深层结构
51结构性问题
511有向图及前馈神经网络
512深层路径
513从深层结构到松弛结构
514分类器、回归器和自动编码器
52布尔函数的实现
521与或门的典型实现
522通用的与非实现
523浅层与深层实现
524基于LTU的实现和复杂性问题
53实值函数实现
531基于几何的计算实现
532通用近似
533解空间及分离表面
534深层网络和表征问题
54卷积网络
541内核、卷积和感受野
542合并不变性
543深度卷积网络
55前馈神经网络上的学习
551监督学习
552反向传播
553符号微分以及自动求导法则
554正则化问题
56复杂度问题
561关于局部最小值的问题
562面临饱和
563复杂性与数值问题
57注释
第6章约束下的学习与推理
61约束机
611学习和推理
612约束环境的统一视图
613学习任务的函数表示
614约束下的推理
62环境中的逻辑约束
621形式逻辑与推理的复杂度
622含符号和子符号的环境
623t范数
624ukasiewicz命题逻辑
63扩散机
631数据模型
632时空环境中的扩散
633循环神经网络
64算法问题
641基于内容的逐点约束
642输入空间中的命题约束
643线性约束的监督学习
644扩散约束下的学习
65终身学习代理
651认知行为及时间流动
652能量平衡
653焦点关注、教学及主动学习
654发展学习
66注释
第7章结语
第8章练习答案
附录A有限维的约束优化
附录B正则算子
附录C变分计算
附录D符号索引
参考文献(在线)
可以访问华章图书官网http:www.hzbook.com,通过注册并登录个人账号下载。编辑注
|
內容試閱:
|
机器学习代表我们在技术层面对理解人类智能本质的期望。因为在计算机这一领域机器学习无法被完全解释,因此它并不是对人类模式的一种巧妙的仿真。虽然深入了解神经科学的奥秘可能会激发出关于智能背后的计算智能的全新想法,但是现阶段大多数机器学习的进步都依赖根植于数学的模型和相应的计算机实现。尽管脑科学可能会继续朝着与人工计算方案结合的方向前进,但我们依然可以合理地推测,认知产生的基础不一定要在生物解决方案的惊人复杂性中进行探索,而主要是在更高层次的计算规律中探索。支持不同认知形式的生物学方案实际上与支持其他基本生命功能(如新陈代谢、生长、体重调节和压力反应)的平行需求密切相关。然而,无论这种复杂的环境如何,大多数类人类智能的过程都可能出现。人们可能会怀疑这些过程是基于信息认知规律的,而这些规律与生物学并无关系。有明确的证据证明在特定的认知任务中存在这种不变性,但是人工智能的挑战每天都在扩大这些任务的范围。虽然没有人会对数学和逻辑运算中的计算能力感到惊讶,但是外行并不十分清楚这些游戏上的挑战的结果。事实上,它们通常被认为是智能的独特标志。而且很明显的是,游戏已经由计算机程序开始主导。Sam Loyd 的15谜问题和魔方是计算机程序在解谜游戏中非常成功的例子。还有最近的国际象棋和围棋,在这些领域机器打破了人类智能的统治地位。不过,对于许多在语言、视觉和运动控制方面的认知能力,现阶段的机器学习仍然很难实现。
本书提供了一个统一的学科视图,该学科将环境建模为满足智能体期望的约束条件的集合,将读者带入机器学习的迷人领域。几乎所有在机器学习中面临的任务都可以在这个数学框架下建模。线性和线性阈值机、神经网络和核方法通常被认为是需要软性满足对应于训练集的一组逐点约束的自适应模型。在功能和经验形式中,经典的风险都可以看作软约束系统中最小化的惩罚函数。无监督学习可以给出类似的公式,其中惩罚函数在某种程度上提供了对数据概率分布的解释。基于信息的索引可用于提取无监督的特征,并且可以将它们明确地视为实施软约束的一种方式。然而,智能体可以从在某种逻辑形式主义中给出的抽象知识粒子中获益。虽然人工智能在知识表示和自动推理领域已经很成熟,但是根植于逻辑的基础理论导致模型不能与机器学习紧密结合。将符号知识库作为约束集合的同时,本书开辟了与机器学习深度融合的道路,这种机器学习依赖于采用多值逻辑形式的思想,如模糊系统。值得注意的是,深度学习非常适用于本书中所采用的基于约束的方法。最近深度学习在代表性问题和学习方面的一些基本成就,加上对并行计算的适当利用,已经为世界各地相关领域的高科技公司的发展创造了梦幻般的催化剂。在本书中我尽自己所能,在受约束的环境框架中揭示深度学习的力量及深度学习的解释。在这样做的过程中,我希望能够激发读者去学习适当的背景知识,以便能够快速掌握之后的创新。
在整本书中,我希望读者能够充分参与到这门学科中,以便形成自己的观点,而不仅仅是融入他人所提供的框架。本书为机器学习的基本模型和算法提供了一种令人耳目一新的方法,其中对约束的关注很好地模糊了有监督、无监督和半监督学习之间的经典差异。以下是本书的一些特点:
这是一本概述性的书籍,适合所有希望对基本概念有深入理解的读者。
本书旨在提出问题并帮助读者逐步学习基本方法,而不仅仅是提供烹饪食谱。
本书提出采用约束的概念,作为对现今最常见的机器学习方法的真正统一的处理方式,同时结合在AI社区中占主导地位的逻辑形式主义的力量。
根据 Donald Knuth 难度排名(略微修改),书中包含了很多练习题,并且提供了答案。
本书是为具有数学和计算机科学基础背景的读者准备的。更多更新的主题可参照附录。强烈建议读者用批判性的思维来阅读,并通过练习题来巩固相关概念。建议读者先独立完成这些题目,再查阅书后的练习答案。在撰写本书时,我的主要目标是让读者感受到和创造者一样的兴奋,并用这种方式来呈现概念和结果。读者不仅仅是被动阅读,还应该充分参与该学科并积极学习。如今,人们可以快速地学习基础知识,并开始部署常见的机器学习主题,这归功于有着精美插图和精彩模拟的网络资源。这些资源为想要进入该领域的人提供了便捷且有效的支持。这些网络资源爆炸性增长并且可以快速用于应用程序开发,因此一本关于机器学习的书很难与其竞争。但如果你想更深刻地理解该学科,那么必须将注意力转移到基础上,并将更多的时间花在可能适用于实际应用中的许多算法和技术解决方案的基本原则上。撰写本书的重要目标就是提出基本的思想,并提供一个统一的以基于信息的学习法则为中心的观点。本书雏形主要源自在锡耶纳大学的硕士和博士课程中收集的材料,之后用我自己在环境约束的统一概念下的可解释学习的观点逐渐丰富了它。考虑到网络资源如此充足,本书可以作为硕士生学习机器学习知识的教科书,也可以用于补充模式识别、数据挖掘和相关学科的课程。本书的某些部分更适合博士生的课程。另外,一些练习题实际上是对研究问题的认真选
|
|