新書推薦:
《
理想城市:环境与诗性
》
售價:HK$
85.8
《
大模型推荐系统:算法原理、代码实战与案例分析
》
售價:HK$
97.9
《
逆风翻盘 危机时代的亿万赢家 在充满危机与风险的世界里,学会与之共舞并找到致富与生存之道
》
售價:HK$
137.5
《
工业互联网导论
》
售價:HK$
97.9
《
木偶的恨意(法国悬念大师米歇尔普西悬疑新作)
》
售價:HK$
64.9
《
孤独传:一种现代情感的历史
》
售價:HK$
85.8
《
家、金钱和孩子
》
售價:HK$
64.9
《
形而上学与测量
》
售價:HK$
74.8
|
編輯推薦: |
知识图谱作为当前人工智能的重要方向之一,不仅被实验室的研究者关注,更被各行各业的商业应用所关注。知识图谱是一个古老而又崭新的课题,是知识工程在新时代的新形态。智能离不开知识。知识始终是人工智能的核心之一。本书按照知识表示、知识库构建、知识推理和知识应用的基本脉络,全面介绍有关知识图谱的前沿技术。为便于理解和融会贯通,本书也对相关 NLP与机器学习的基本知识与知识图谱的经典传统方法进行了适当描述。
本书既可作为人工智能领域研究人员的技术参考书,也可作为高等院校相关专业师生的教学参考书。
|
內容簡介: |
知识图谱作为当前人工智能的重要方向之一,不仅被实验室的研究者关注,更被各行各业的商业应用所关注。知识图谱是一个古老而又崭新的课题,是知识工程在新时代的新形态。智能离不开知识。知识始终是人工智能的核心之一。本书按照知识表示、知识库构建、知识推理和知识应用的基本脉络,全面介绍有关知识图谱的前沿技术。为便于理解和融会贯通,本书也对相关 NLP与机器学习的基本知识与知识图谱的经典传统方法进行了适当描述。本书既可作为人工智能领域研究人员的技术参考书,也可作为高等院校相关专业师生的教学参考书。
|
關於作者: |
朱小燕,清华大学,教授,著名的人工智能领域专家,入选2019年度中国人工智能100人榜单,现任智能技术与系统国家重点实验室主任。
|
目錄:
|
第1章绪论
11什么是知识
12知识类型与知识金字塔
13什么是知识图谱
14知识图谱的发展历史
15知识图谱研究的主要内容
151知识表示
152构建知识库
153知识推理
154知识应用
16本书内容安排
第2章传统知识表示与建模
21知识表示的基本概念
22基于逻辑的知识表示
221逻辑的基本概念
222命题逻辑
223谓词逻辑
224归结原理
23产生式表示方法
231事实与规则的表示
232产生式系统的结构
233产生式系统的推理
24语义网络表示方法
241语义网络的历史
242语义网络的结构
243语义网络的实例
244基本的语义关系
245语义网络的推理
25框架表示方法
251框架理论的概念
252框架的结构和框架的推理
26其他表示方法
261脚本知识表示方法
262过程性知识表示方法
27本章小结
第3章现代文本表示学习基础
31文本表示学习的基础模型
311单词的分布表示
312句子的分布表示
313文档的分布表示
32文本表示学习的进阶模型
321ELMo
322GPT
323BERT
33文本表示与知识表示
34本章小结
第4章现代知识表示与学习
41基于几何变换的知识图谱表示学习
411基于平移原则的知识图谱表示学习
412基于混合几何变换的知识图谱表示学习
413基于流形原则的知识图谱表示学习
42基于神经网络的知识图谱表示模型
421距离模型
422简单网络模型
423复杂网络模型
43结合文本的知识图谱表示方法SSP
431研究背景
432模型描述
44本章小结
第5章知识图谱的构建
51命名实体识别
511什么是命名实体
512任务概述
513传统的命名实体识别方法
514基于深度学习的命名实体识别方法
515基于深度学习的命名实体识别新模型及新思路
52命名实体链接
521任务概述
522传统的命名实体链接方法
523基于深度学习的命名实体链接方法
53命名实体关系抽取
531任务概述
532传统的命名实体关系抽取方法
533基于深度学习的命名实体关系抽取方法
54本章小结
第6章知识推理
61什么是知识推理
62基于符号的知识推理
63基于随机游走的路径排序算法
64基于增强学习的路径推理
641DeepPath
642MINERVA
65基于深度神经网络的路径推理
651Path-RNN
652扩展的Path-RNN
66本章小结
第7章知识图谱的应用
71知识库问答
711基于信息抽取的知识库问答
712基于语义解析的知识库问答
713基于嵌入表示的知识库问答
72知识图谱在文本生成中的应用
721常识知识驱动的对话生成模型
722常识知识驱动的故事结局生成模型
73知识图谱在情感挖掘中的应用
731语言学知识驱动的情感分类
732知识图谱驱动的情感分析
74本章小结
第8章知识图谱资源
81通用的知识图谱资源
811Freebase
812DBpedia
813OpenKG
814NELL
82领域相关的知识图谱资源
821电子商务知识图谱
822中医药知识图谱
83本章小结
参考文献
|
內容試閱:
|
知识图谱作为当前人工智能的重要方向之一,不仅被实验室的研究者关注,更被各行各业的商业应用所关注。知识图谱是一个古老而又崭新的课题,是知识工程在新时代的新形态。智能离不开知识。知识始终是人工智能的核心之一。从计算机诞生不久,人们就希望借助知识来帮助实现智能系统,至今已研究半个多世纪。当代知识图谱的研究热潮是建立在多年研究发展和探索之上的。如今,知识图谱不仅在理论上有坚实的基础,而且在规模、存储和计算上都具备了实际应用的条件。知识图谱技术不是一种单一的技术,而是人工智能各个领域的发展在知识工程上的集中体现,并且还在方兴未艾地蓬勃发展。我们正站在这个潮头之上,希望从林林总总的研究中梳理出相对最前沿的思想、技术与方法,使读者在了解知识图谱基本概念的基础上,能够直接接触知识图谱的最新研究成果。这是我们编写本书的出发点。从根本上说,知识是人类智能的重要组成部分。知识并没有一个统一和一致的定义。一般认为,知识是人类在实践中认识客观世界(包括人类自身)的成果,包括对事实、信息的描述及在教育和实践中获得的技能。换言之,知识是人类从各个途径获得的经过提升、总结与凝练的系统性认识。对于人工智能来说,知识是计算机可以表示、存储和计算的一类特殊信息,是经过凝练的信息,是信息中的精华,包括陈述性知识、过程性知识和元知识。人工智能离不开知识。知识工程也随着人工智能的发展而不断地演化和进步。最初的人工智能研究从推理和问题求解出发构建智能系统,希望通过逻辑验算进行图灵测试。但知识并没有得到重视。1977年,费根鲍姆(Edward A Feigenbaum)提出知识工程的概念,把知识作为智能系统的核心。从此,知识工程获得发展,各种各样的知识表示方式应运而生,如谓词逻辑、语义网络、产生式规则、框架和脚本等。虽然手工构建的专家知识库在专家系统等应用中取得了很好的成绩,但也伴随着知识库构造困难、推理效率低等问题。互联网的发展使得数据产生爆炸性的增长,不仅让知识的获取有了更多的来源,而且能够更好地从语义上理解网页所代表的信息,从而使得对知识的需求成了新的增长点。Tim Berners-Lee提出了语义网,用本体的概念化体系对客观世界进行描述,并通过一套统一的描述方式对网页内容进行语义标记,使得网页互联变成内容互联,甚至是语义互联,在此基础上形成以RDF(Resource Description Framework)为模型的知识表示体系,并逐渐演变成一整套成熟的知识表示、序列化、查询、存储的规范。该规范成为现代知识图谱的基础。特别是在Web 20出现之后,维基百科以多人协作的方式产生了海量的知识类数据,并成为大规模知识库的主要来源之一。在此基础上产生的DBpedia 和Freebase 是当代大规模知识图谱的雏形。与此同时,研究者在知识本体的基础上制定了复杂的描述逻辑和规则体系,希望借此对知识进行逻辑推理。虽然这些尝试取得了一定的成果,但由于知识的复杂性和描述逻辑的局限性,因此并没有真正应用到实际中。2012年,Google在Freebase的基础之上构建了大规模的知识库Knowledge Graph (知识图谱),并将其应用于搜索结果的改善,从此拉开了当代知识图谱大规模应用的序幕,进而推动了大规模知识图谱的构建热潮。除了前述的大型知识库,还有诸如YAGO、NELL、Probase、openKG、cnSchema、cn-DBpedia等若干开放域知识库。这些知识图谱的构建与应用大大促进了知识图谱相关技术的发展。现代知识图谱技术发端于知识工程,结合大数据处理、统计机器学习算法、深度学习算法等技术,受益于越来越多的结构化、半结构化和非结构化数据及越来越强的计算能力,在知识库的表示、构建、推理与应用方面都有了非常大的进展,不仅在通用领域,而且在各个专用垂直领域(金融、保险、商业、医疗、法律等)也促进了若干智能应用(智能检索、智能问答、推理决策、文书生成、情感分析)的进步。从学术的角度来说,当代人工智能技术越来越离不开知识,离不开知识图谱的支撑。无论是基于统计机器学习的算法,还是基于深度学习的算法,在解释性和推理性方面都存在弱点,使研究者更加清晰地认识到规则与统计的完美结合才是人类拥有智能的本质,所以学术界也在日益关注如何从各个方面将流行的基于统计的学习算法和知识规则相结合。从应用的角度,尤其是对可解释性要求高的系统,更希望可以将各种类型的知识融入系统的构建和使用的过程。可以说,应用是推动知识图谱进步的动力;数据和算法的发展是知识图谱不断发展的基础。当代知识图谱技术主要体现在知识表示、知识库构建、知识推理与知识应用等方面。特别是随着近些年深度神经网络的发展,如何将知识融入语义理解与语言生成的计算中是研究的重要课题。从知识的表示方面来看,由资源描述框架统一表示的知识图谱本质上是一个由节点和边组成的庞大有向连接图,可分解为由头、尾和关系构成的三元组的集合,从而基于图的性质和三元组的统计特性,可在知识图谱相关领域应用到最新的机器学习算法与模型中。特别是分布式向量知识表示的发展,把知识图谱的实体与关系映射到稠密的低维向量空间,使知识图谱的可计算性有了很大的提高,大大便利了知识检索、知识推理、知识辅助理解等方面的应用;把知识的分布式向量知识表示与深度神经网络相结合,把知识融入语言模型和语义模型的计算中,均大大增强了对语义理解的能力。现代机器学习算法对于知识图谱的表示、构建、推理和应用都起到了非常大的推动作用,包括概率统计模型、空间分解算法、深度神经元网络、预训练语言模型、主动学习、增强学习、迁移学习、对抗学习、无监督学习、半监督学习、远程监督学习等。知识图谱技术不是单一的技术,而是将多种技术融合在一起,用于处理从自然文本、半结构化数据到知识,再到应用的全流程生命链。知识库的构建需要从自然语言中抽取相关类别的实体及实体与实体之间的关系。最新的机器学习算法在这方面起到了很大的促进作用,特别是深度神经语言模型的应用,把潜在语义和知识有机地结合起来。基于大规模知识库和分布式向量知识表示的知识推理同样可以借助深度学习和增强学习的方法,有效进行知识补全、校验和链接预测等工作。在实际应用中,将知识与深度模型相结合可大大提升机器问答、语言生成和情感分析等NLP (Natual Language Processing)任务的性能。我们编写本书的目的是为了让读者可以追踪知识图谱的前沿发展,把握知识图谱的技术方向,开阔眼界,面向未来。因此,本书将按照知识表示、知识库构建、知识推理和知识应用的基本脉络,全面介绍有关知识图谱的前沿技术。为便于理解和融会贯通,本书也对相关NLP与机器学习的基本知识及知识图谱的经典传统方法进行适当的描述。当然,知识图谱技术还在不断发展,当前的知识图谱技术还存在很多问题,主要体现在知识和语言模型虽然相关,但是在人类智能体系中却处于不同的层次和范畴;现有的融合方式虽然有一定效果,但还处于比较初级和生硬的阶段,未能很好地体现知识在高层推理与解释方面的作用,知识对于系统智能性起到的效果还达不到预期。这些都有待于今后的进一步研究。在人工智能新纪元的今天,NLP是人工智能皇冠上的明珠,知识就是连接皇冠与明珠的基座。有多大的基座就能够承载多大的明珠,有稳定坚实的基座,明珠才能够永放光芒。本书内容包含我们研究小组的部分研究成果及相关学术界的研究进展。本书由朱小燕和黄民烈组织编写,李晶、郝宇、肖寒等参与了重要章节的编写,王业全、周曼桐、周昊、关键等同学参与了知识图谱应用和资源等方面章节的编写,黄斐、高信龙一、邵志宏、关键等同学参与了校对工作。在本书编写过程中,东南大学漆桂林教授对于OpenKG等工作给出了建设性的意见。感谢电子工业出版社在出版过程中给予的大力支持和帮助。感谢多年来对我们工作给予大力支持和帮助的各位师长、同事、同行和朋友们。知识图谱是本次人工智能浪潮发展最快的研究分支之一,新技术、新研究层出不穷,有疏漏甚至错误的地方,请读者批评指正。
|
|