新書推薦:
《
迟缓的巨人:“大而不能倒”的反思与人性化转向
》
售價:HK$
77.3
《
我们去往何方:身体、身份和个人价值
》
售價:HK$
67.0
《
大学问·批判的武器:罗莎·卢森堡与同时代思想者的论争
》
售價:HK$
98.6
《
低薪困境:剖析日本经济低迷的根本原因
》
售價:HK$
66.1
《
穷人的银行家(诺贝尔和平奖获得者穆罕默德·尤努斯自传)
》
售價:HK$
76.2
《
绵延:文明分野与文化演进
》
售價:HK$
66.1
《
三神之战:罗马,波斯与阿拉伯帝国的崛起
》
售價:HK$
80.6
《
慢慢变富66招
》
售價:HK$
53.8
編輯推薦:
让机器会写作:全球AI写作平台创始人、北京大学高材生、知乎NLP大V、知名“大厂”特约作者, 通过小白都能懂的语言,解读晦涩难懂的前沿技术,带领机器从牙牙学语到行云流水。
內容簡介:
《自然语言处理NLP从入门到项目实战:Python语言实现》从人工智能和自然语言处理技术的基础原理讲起,逐步深入自然语言处理进阶实战,并配有实战代码讲解,重点介绍了使用开源技术、人工智能开放平台,以及使用国内外优秀开发框架进行基于规则、统计、深度学习的自然语言处理程序开发,让读者全面掌握理论基础,并学以致用。
《自然语言处理NLP从入门到项目实战:Python语言实现》分为12章,主要包括学习人工智能原理、自然语言处理技术、掌握深度学习模型、NLP开源技术实战、Python神经网络计算实战、AI语音合成有声小说实战、玩转词向量、近义词查询系统实战、机器翻译系统实战、文本情感分析系统实战、电话销售语义分析系统实战人工智能辅助写作系统(独家专利技术解密)。
《自然语言处理NLP从入门到项目实战:Python语言实现》内容通俗易懂,案例丰富,实用性强,特别适合使用Python语言人工智能自然语言处理的入门和进阶的读者阅读,也适合产品经理、人工智能研究者等对人工智能自然语言处理感兴趣的读者阅读。另外,《自然语言处理NLP从入门到项目实战:Python语言实现》也适合作为相关培训机构的教材使用。
關於作者:
艾浒
北京大学计算机专业学士
北京百灵互联科技有限公司创始人兼CTO
芭莎宝贝(北京)文化传媒有限公司联合创始人兼CTO
北京生生万年科技CTO
全球首款AI写作平台L8ai.com创始人
15年人工智能科技/互联网/媒体行业经验
快手/百度//喜马拉雅/蚂蚁集团等知名“大厂”特约撰稿人,在知乎上获得4000万阅读量
发明专利:一种人工智能辅助写作系统
软件著作权:百灵AI智能写作平台
目錄 :
篇 人工智能自然语言处理基础篇
第1章 人工智能原理
1.1 人工智能简史
1.1.1 意识研究历史及经典理论
1.1.2 意识研究的热点问题和经典答案
1.1.3 人工智能经典理论
1.1.4 人工智能的本质
1.2 神经网络原理
1.2.1 神经科学家
1.2.2 神经科学经典理论
1.2.3 学习和记忆的原理
1.2.4 神经网络模型
1.3 矩阵与思维
1.3.1 矩阵与树突
1.3.2 矩阵与联想
第2章 掌握自然语言处理技术
2.1 自然语言处理技术与人工智能
2.1.1 自然语言处理技术与人工智能的关系
2.1.2 NLP技术的定义与分类
2.2 NLP技术概述
2.2.1 NLP算法的三个发展阶段
2.2.2 基于规则的NLP算法
2.2.3 基于统计的NLP算法
2.2.4 基于深度学习的NLP算法
2.3 NLP商业技术
2.3.1 百度NLP技术
2.3.2 科大讯飞的NLP技术
2.3.3 腾讯的NLP技术
2.4 小结
第3章 掌握深度学习模型
3.1 深度学习与人工智能
3.1.1 机器学习定义
3.1.2 机器学习评估标准
3.2 深度学习模型的基础知识
3.2.1 NNLM模型
3.2.2 Word2vec模型
3.2.3 fastText模型
3.2.4 TextCNN模型
3.2.5 Seq2Seq模型
3.3 深度学习模型进阶知识
3.3.1 基于Encoder-Decoder框架的注意力机制
3.3.2 引入Attention机制的RNN模型
3.3.3 Attention进阶知识
3.3.4 Transformer模型
3.3.5 GPT模型
第二篇 自然语言处理系统实战篇
第4章 NLP开源技术实战
4.1 NLP开发工具简介与环境搭建
4.1.1 Python 2和Python 3
4.1.2 运行Python代码片段
4.1.3 在不同操作系统中搭建Python编程环境
4.1.4 在Linux系统中搭建Python编程环境
4.1.5 在Windows系统中搭建Python编程环境
4.1.6 安装Anaconda科学包
4.2 掌握Visual Studio Code 源代码编辑器
4.2.1 VSCode 安装与启动
4.2.2 为VSCode配置Python解析器
4.2.3 使用VSCode运行Python代码
4.2.4 使用VSCode调试Python代码
4.3 开源社区GitHub的简介与环境搭建
4.3.1 GitHub Desktop安装方法
4.3.2 使用GitHub发布代码仓库
4.3.3 使VSCode与GitHub协作
4.4 jieba NLP技术实战
4.4.1 结巴(jieba)分词简介
4.4.2 在VSCode中安装jieba分词工具
4.4.3 在VSCode中调用jieba分词的主要功能
4.4.4 jieba分词代码详解
4.4.5 jieba自定义词典实战
4.4.6 jieba词性标注实战
4.5 jiagu NLP技术实战
4.5.1 甲骨(jiagu)分词简介
4.5.2 jiagu安装与入门实战
4.5.3 jiagu命名实体识别、文本摘要、知识图谱、情感分析、文本聚类实战
4.6 斯坦福大学开源NLP实战
4.6.1 Stanza简介与安装
4.6.2 通用依赖树库简介与下载
4.6.3 Stanza流水线自然语言处理实战
4.6.4 Stanza流水线与工序实战
4.6.5 详解Stanza中的对象
4.6.6 Stanza的依存句法分析实战
4.6.7 Graphviz&NetworkX依存句法图形化实战
4.7 百度开源中文词汇分析LAC 2.0实战
4.7.1 LAC 2.0简介
4.7.2 LAC 2.0 安装与基础功能实战
4.8 小结
第5章 Python神经网络计算实战
5.1 TensorFlow
5.1.1 TensorFlow生态系统和社区资源
5.1.2 TensorFlow 2.x的版本与特性
5.2 CPU\\GPU环境搭建
5.2.1 TensorFlow的CPU环境搭建
5.2.2 TensorFlow的GPU环境搭建
5.3 Keras手写识别实战
5.3.1 神经网络输入、输出实战
5.3.2 神经网络的结构定义
5.3.3 经典神经网络模型
5.3.4 神经网络评价函数
5.3.5 运行神经网络
5.4 其他神经网络工具包
5.4.1 PyTorch简介
5.4.2 使用 PyTorch 编写LSTM词性识别实战
5.5 小结
第6章 AI语音合成有声小说实战
6.1 Python互联网编程实战
6.1.1 Python的HTTP编程实战
6.1.2 Python的WebSocket编程实战
6.2 JSON数据结构原理与实战
6.2.1 JSON数据交换格式原理
6.2.2 Python语言的JSON编程实战
6.3 AI语音合成实战
6.3.1 科大讯飞NLP服务
6.3.2 AI语音合成有声小说实战
6.3.3 NLP商业API的HTTP调用实战
第7章 玩转词向量
7.1 词向量原理
7.1.1 词向量技术的发展
7.1.2 掌握开源词向量技术
7.1.3 词向量下载
7.2 词向量数据结构优化
7.2.1 掌握数据库技术
7.2.2 使用Pymssql操作数据库
7.2.3 词向量入库
7.3 词向量使用方法
7.3.1 掌握数据库的查询方法
7.3.2 使用Python操作数据库查询结果
7.4 小结
第8章 近义词查询系统实战
8.1 近义词查询系统原理
8.1.1 近义词向量相似度
8.1.2 文本相似度
8.2 中文词语相似度计算
8.2.1 词向量相似度算法原理
8.2.2 词向量相似度算法实现
8.3 近义词系统实战
8.3.1 词向量加载
8.3.2 近义词查询
8.3.3 相似度排序与效率优化
8.4 小结
第9章 机器翻译系统实战
9.1 基于商业云服务的机器翻译实战
9.1.1 机器翻译的历史、商业前景及应用范围
9.1.2 Niutrans机器翻译实战
9.2 深度神经网络机器翻译实战
9.2.1 深度学习数据集预处理实战
9.2.2 引入注意力机制的Encoder-Decoder深度神经网络配置实战
9.2.3 引入注意力机制的Encoder-Decoder深度神经网络训练实战
第10章 文本情感分析系统实战
10.1 情绪认知理论
10.1.1 情绪认知经典理论
10.1.2 计算机情绪认知技术
10.2 文本情感分析系统原理
10.2.1 基于规则和统计的情感分析系统
10.2.2 基于深度学习的情感分析系统
10.3 基于规则文本情感分析系统实战
10.3.1 词库设计原理
10.3.2 情绪分数计算
10.4 基于深度学习的文本情感分析系统实战
10.4.1 LightGBM的安装与简介
10.4.2 掌握LightGBM的使用方法
10.4.3 Kaggle人工智能算法竞赛平台的使用方法
10.4.4 使用LightGBM实现情感分析实战
10.4.5 Paddle EasyDL平台ERNIE深度神经网络训练实战
10.4.6 EasyDL电商行业评论情绪分类系统部署
10.5 小结
第11章 电话销售语义分析系统实战
11.1 掌握语音识别技术
11.1.1 pyAudio录音实战
11.1.2 阿里语音识别技术实战
11.2 词频与相似度计算实战
11.2.1 词频计算
11.2.2 相似度计算
11.2.3 预计算与提速
11.3 抽取用户特征实战
11.3.1 抽取客户姓名、地址、工作单位
11.3.2 抽取交易细节及通话文本训练
11.4 其他特征的提取
11.4.1 销售意向分析实战
11.4.2 时间特征提取实战
11.5 小结
第12章 人工智能辅助写作系统
12.1 人工智能辅助写作原理
12.1.1 矩阵联想算法原理
12.1.2 矩阵联想算法示例
12.2 人工智能写作实战
12.2.1 人工智能写高考作文实战
12.2.2 使用人工智能提高人类联想能力实战
12.3 人工智能联想服务实战
12.3.1 人工智能联想服务接口文档
12.3.2 使用Python调用人工智能联想服务实战
內容試閱 :
这本书写到一半时,我做了一件微不足道的小事,引发了几件难以置信的怪事。
微不足道的小事,是我 2020 年 8 月 5 日中午等泡面时,花了 10 分钟,写了一篇高考作文,发布到了知乎上。
难以置信的是,当天晚上,一家创业公司老板看到这篇作文后,便想让我以技术入股。第二天一早,中国移动的子公司向我发出邀请,要与我合作开发教育产品。几天后,2019 Apple 播客——追科技撩艺术,要做一期节目采访我。又过了几天,一个投资人要帮我注册公司、申请专利和软件著作权。等到8月底的时候,公司已经注册好了,名字叫北京百灵互联科技有限公司。后来有一家叫芭莎宝贝的公司邀请我做联合创始人,还有一家叫生生万年的公司邀请我做CTO(首席技术官)。
写高考作文是一个很偶然的机会。那天中午,我在知乎上看到一个提问:“2020年高考满分作文《生活在树上》到底表达了什么观点,能否用通俗的语言翻译出来?”打开这个问题链接,就看到一些答主说,这篇满分作文像是机器人写的。
为了给机器人洗脱罪名,我用机器人写了一篇作文,并简述了机器人的写作方法,然后发布到知乎上。这个机器人是我利用业余时间独立开发的人工智能写作网站,域名为L8AI.com,表示来吧AI,拥抱未来的意思。它理解并记忆了鲁迅、朱自清、莎士比亚、徐志摩等数百位文豪的500万条文学作品片段。当用户输入自己的文章后,人工智能就会根据用户的文章进行联想,然后呈现出与用户文章语义相近的名著片段,达到引经据典、润色、激发用户灵感的效果,适用于文学创作、自媒体撰稿、剧本构思等与写作相关的领域。
2019年 5月,我在知乎公布这个网站后,便深受知乎网友的喜爱,并积累了一大批忠实用户。百度搜索“AI写作”,排在位的非广告类文章,就是我写的网站发布公告。之所以得到大家的认可,是因为人工智能可以让普通人拥有海量文学作品记忆和超高速的语义联想能力,宛如过目不忘的超人一般,轻松创作出优秀的文学作品。
虽然是一件微不足道的小事,但小事一分钟,背后十年功。知识改变了我的命运,所以我想把这些知识写成书,希望一本好书可以改变无数人的命运。
而写一本好书,首先需要熟练的文笔。
有些作者虽然懂技术,但是文笔不好,写出来的书就晦涩难懂。
我是一名业余作家,获得知乎 56万赞同和 4000万阅读量。多年的写作经验,使我有能力用通俗易懂的文字把前沿技术概念表达清楚。
除了熟练的文笔,作者还需要具有深厚的技术功底。我是北大计算机专业毕业的,十多年前在北大,每天至少泡在图书馆6小时,研究人工智能基础理论。
但即便有了扎实的理论基础和熟练的文笔,倘若只是在象牙塔里闭门造车,也无法写出好书。而我有十余年软件行业项目管理经验,还发明了人工智能写作工具,并且创立了公司。所以我写的书,呈现的是符合市场需求和技术发展趋势的实用型技术,观念具有前瞻性。读者学会后,马上就能用于商业产品开发。
虽然书写到一半时,有前文所述的难以置信的怪事打扰我,但我并没有敷衍的想法,反而更加认真地写这本书,并且把已经写好的部分,又反复完善了几次。因为那些改变命运的怪事,更加坚定了我写书的初衷,让我更有信心写出一本可以改变读者命运的书。
本书主要内容是人工智能原理和自然语言处理技术实战,目标读者包括以下五类:
人工智能行业的创业者、产品经理,以及人工智能技术爱好者,可以从本书中了解人类意识研究的历史、相关基础理论、人工智能自然语言理解的理论知识,以及新技术的发展方向。
没有 AI开发经验的初学者可以学到如何通过云服务和开源技术快速开发出强大的人工智能程序。 现在很多创业公司和个人开发者,都是把人工智能云服务进行拼装和包装,然后加价卖给消费者。能力强的程序员,会利用免费的开源代码,在许可协议的限制下,拼装出强大的商业软件进行谋利。有些开源许可协议是非常宽松的,使用者有权使用、复制、修改、合并、出版发行、散布、再授权及贩售软件及软件的副本。本书内容包括这些人工智能云服务和开源代码的实战知识。学习完本书,读者也可以参与到这场“淘金潮”中。
对于中高级的读者,可以学到前沿的深度神经网络技术,利用这些技术,可以开发出功能更强大、成本更低的人工智能程序。
对于其他行业想转行至人工智能行业的,也能从中学到很多实用的知识。
由于传统企业都很明白,这个年代不转型不行,转型就要引进人才,而互联网上开源代码多如牛毛,可以很快为传统企业赋能,让传统企业乘上人工智能的东风。
市场上缺少这种跨行业的开发者。如果你具备本行业的理论基础,再把人工智能开源代码的原理讲 清楚,阐述一下振奋人心的创新点,进入这个行业是没问题的。学习完本书,借鉴开源代码稍微修改一下就是你的成果,产出比会非常高。
对于自媒体撰稿人、编剧、作家、语文老师等文字工作者,可以从中学到如何使用人工智能工具提高人类的联想力和记忆力,并快速进行文学创作。
后,我要感谢我的妈妈,她的名字叫张富花。我出生时先天残疾,患有严重的脊椎裂,脊髓膨出,她倾家荡产为我治疗,没有抛弃我,一直供我到大学毕业。
还有,我爸爸二十多年前出车祸,一直瘫痪在床,多亏我妈妈二十多年的细心照顾,倾其所有为我父亲治病。
谢谢妈妈,儿子一定努力,不辜负您的期望。
另外,如果读者对文中提到的我用机器人写的文章和“追科技撩艺术”对我的节目专访感兴趣,可以扫描下方二维码观看和阅读。需要着重说明的是,本书的程序代码作为随书赠送资源提供给作者使用,读者可关注“博雅读书社”微信公众号,输入本书77页的资源下载码,根据提示下载资源。
文章地址
追科技撩艺术播客
“博雅读书社”微信公众号
艾 浒