新書推薦:

《
历史的镜子
》
售價:HK$
61.6

《
我们还是香格里拉的囚徒吗:藏学、国学与语文学(二)
》
售價:HK$
107.8

《
制造怪物:非人化的异常力量
》
售價:HK$
107.8

《
人格类型:我们何以不同(荣格人格类型理论——人格类型是一种人们了解自己、了解人际困扰的方法)
》
售價:HK$
64.9

《
索恩丛书·宗教与资本主义的兴起
》
售價:HK$
141.9

《
遇见 高云
》
售價:HK$
85.8

《
日本首都圈空间结构与协同发展
》
售價:HK$
140.8

《
《欧罗巴的悲剧:经济危机、绥靖政策与第二次世界大战的爆发》
》
售價:HK$
83.6
|
內容簡介: |
本书全面介绍了自然语言处理(NLP)的核心概念与技术,内容覆盖文本预处理、文本的多种表示方法,深入探讨了文本分类、聚类技术,以及信息抽取和实体识别,还涉及了机器翻译、自动摘要、智能问答与对话系统,以及情感分析和舆情监测等高级应用。此外,对知识图谱的构建和应用,以及损失函数与模型优化也进行了详细阐述,为读者提供了自然语言处理领域的系统性知识。本书适合AI、机器学习、深度学习及自然语言处理的爱好者阅读,也可以作为高等院校的教材使用。
|
關於作者: |
谢美萍,本科与硕士毕业于西北工业大学,博士毕业于哈尔滨工程大学,2001年至今为上海财经大学信息管理与工程学院 副教授,研究生导师,主要研究方向为数据挖掘与数据分析、非线性系统建模、机器学习。
|
目錄:
|
目 录 第1章 绪 论1 1.1 自然语言处理的定义和发展历程1 1.1.1 自然语言处理的定义2 1.1.2 自然语言处理的发展历程2 1.2 自然语言处理的研究内容和研究方法5 1.2.1 自然语言处理的研究内容5 1.2.2 自然语言处理的研究方法8 1.3 自然语言处理的应用和前景8 1.4 自然语言处理的开发环境9 本章小结12 第2章 文本预处理14 2.1 文本清洗和去噪14 2.2 词法分析16 2.2.1 中文分词16 2.2.2 词性标注28 2.3 句法分析31 2.3.1 句法分析的概念32 2.3.2 句法分析树库及其评测方法33 2.3.3 依存句法分析36 2.3.4 依存句法分析工具38 2.4 语义分析39 2.4.1 词义消歧39 2.4.2 语义角色标注42 2.4.3 语义分析面临的挑战45 本章小结46 第3章 文本表示方法47 3.1 One-Hot编码47 3.2 词袋模型49 3.3 TF-IDF方法50 3.4 Word2Vec方法53 3.4.1 连续词袋模型54 3.4.2 Skip-gram模型56 3.4.3 Word2Vec的应用57 3.5 分布式表示方法60 3.5.1 分布式语义假设60 3.5.2 奇异值分解61 3.6 词嵌入63 本章小结64 第4章 文本分类和聚类65 4.1 文本分类的概念和任务66 4.1.1 文本分类的概念66 4.1.2 文本分类的任务67 4.2 文本分类算法68 4.2.1 朴素贝叶斯算法68 4.2.2 支持向量机72 4.3 文本聚类的概念和任务76 4.3.1 文本聚类的概念76 4.3.2 文本聚类的过程77 4.4 文本聚类算法78 4.4.1 文本聚类中的数据类型及规范化78 4.4.2 文本聚类中的聚类算法81 本章小结86 第5章 信息抽取87 5.1 信息抽取的概念和任务87 5.1.1 信息抽取的相关概念88 5.1.2 信息抽取的任务90 5.2 信息抽取的方法和技术93 5.2.1 基于规则的方法93 5.2.2 有监督学习方法101 5.2.3 无监督学习方法106 5.2.4 半监督学习方法109 本章小结114 第6章 命名实体识别115 6.1 命名实体识别技术的发展现状116 6.2 命名实体识别的概念116 6.3 实体识别模型118 6.3.1 循环神经网络118 6.3.2 BI-LSTM-CRF模型124 6.3.3 Seq2Seq模型128 6.3.4 注意力机制130 6.4 实体识别案例132 本章小结133 第7章 机器翻译和文本摘要134 7.1 机器翻译134 7.1.1 机器翻译概述135 7.1.2 基于规则的机器翻译方法137 7.1.3 基于统计的机器翻译方法138 7.1.4 基于神经网络的机器翻译方法141 7.1.5 机器翻译的质量评价147 7.2 文本摘要149 7.2.1 抽取式摘要149 7.2.2 抽象式摘要151 7.2.3 文本摘要的评估153 本章小结154 第8章 智能问答系统和对话系统155 8.1 智能问答系统155 8.1.1 智能问答系统概述155 8.1.2 智能问答系统的主要组成部分156 8.1.3 智能问答系统的类型160 8.1.4 智能问答系统的评价167 8.2 对话系统169 8.2.1 对话系统概述169 8.2.2 对话系统的基本过程170 8.2.3 对话系统的类型171 8.2.4 对话系统的评价174 本章小结174 第9章 情感分析和舆情监测176 9.1 文本情感分析简介176 9.1.1 文本情感分析的主要内容177 9.1.2 文本情感分析的常见应用179 9.2 情感分析的方法和技术182 9.2.1 基于情感词典的方法183 9.2.2 基于文本分类的方法185 9.2.3 基于LDA主题模型的方法187 9.3 舆情监测简介189 9.3.1 舆情监测的主要内容189 9.3.2 舆情监测的常见应用192 9.4 舆情监测技术194 9.4.1 网络爬虫194 9.4.2 文本情感分析195 9.5 电商产品情感评论数据分析案例196 9.5.1 背景与挖掘目标196 9.5.2 分析方法与过程197 9.5.3 运行结果199 本章小结201 第10章 知识图谱202 10.1 知识图谱概述202 10.1.1 知识图谱的发展历程203 10.1.2 知识图谱的基本概念203 10.1.3 知识图谱的研究内容205 10.2 知识图谱的表示与存储205 10.2.1 知识图谱的符号表示206 10.2.2 知识图谱的向量表示210 10.2.3 基于表的知识图谱存储214 10.2.4 基于图的知识图谱存储219 10.3 知识图谱的构建220 10.3.1 数据获取220 10.3.2 知识抽取220 10.3.3 知识表示221 10.3.4 知识融合221 10.3.5 知识建模222 10.3.6 知识推理222 10.3.7 知识图谱的其他步骤223 10.4 知识图谱的应用226 10.4.1 搜索引擎226 10.4.2 问答系统226 10.4.3 推荐系统227 10.4.4 推理决策227 10.4.5 智能对话227 10.5 构建词云图应用案例228 本章小结229 第11章 损失函数与模型瘦身230 11.1 损失函数230 11.2 常用的损失函数231 11.2.1 0-1损失函数231 11.2.2 交叉熵损失函数231 11.2.3 平均绝对误差损失函数232 11.2.4 均方误差损失函数232 11.2.5 Huber损失函数233 11.2.6 分位数损失函数233 11.2.7 Hinge损失函数234 11.3 模型瘦身234 11.3.1 知识蒸馏235 11.3.2 网络剪枝238 本章小结241
|
|