登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書

『簡體書』AI大模型系统开发技术

書城自編碼: 4120309
分類:簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 鞠时光,周从华,宋香梅,王秀红
國際書號(ISBN): 9787302686088
出版社: 清华大学出版社
出版日期: 2024-12-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 64.9

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
DK生物运转百科(全彩)
《 DK生物运转百科(全彩) 》

售價:HK$ 140.8
规则怪谈:无罪的嫌疑人 《规则怪谈》系列小说第三部重磅来袭!
《 规则怪谈:无罪的嫌疑人 《规则怪谈》系列小说第三部重磅来袭! 》

售價:HK$ 52.8
文明与战乱:两宋风云300年
《 文明与战乱:两宋风云300年 》

售價:HK$ 85.8
万千心理·成人心理治疗计划
《 万千心理·成人心理治疗计划 》

售價:HK$ 107.8
遇阳(全2册)【晋江甜文作者提裙代表作,网络原名《放学后别来我办公室》】
《 遇阳(全2册)【晋江甜文作者提裙代表作,网络原名《放学后别来我办公室》】 》

售價:HK$ 87.8
通胀的教训
《 通胀的教训 》

售價:HK$ 75.9
婚礼的前一天 穗积漫画作品集
《 婚礼的前一天 穗积漫画作品集 》

售價:HK$ 47.1
狂野的希望:在灰暗的日子里找到光亮
《 狂野的希望:在灰暗的日子里找到光亮 》

售價:HK$ 65.8

編輯推薦:
本书通过严谨简明的预备知识介绍,有的放矢地为读者梳理AI大模型开发中涉及的数学知识。然后以自然语言处理、图像理解等实践中拟解决的问题为着眼点,将理解及开发面向行业的大模型系统要解决的问题转换为求解相关的模型。接着循序渐进地给出求解此模型的基础求解方法以及优化求解方法。
本书能够普惠更多希望学习人工智能大模型开发技术的工科研究生及计算机本科高年级学生及工程技术人员,让他们掌握大模型开发的方法并能应用于解决他们所从事的专业上所涉及的实际问题。同时,也可以让读者把人工智能技术的思维带到平时的学习和工作中,启发他们对本专业智能应用的思考与探索。
內容簡介:
”本书系统介绍行业AI大模型系统开发技术。全书共10章,主要内容包括AI大模型概述、AI基础算法、深度学习技术与工具、生成式模型、数据标注技术、注意力机制、Transformer架构解析、自然语言处理中的预训练模型、微调技术以及大语言模型系统安全技术。本书内容逻辑清晰、循序渐进,从理论到实践,从算法到工程实现,引导读者深入理解和逐步掌握行业AI大模型开发关键技术和方法。 本书适合作为高等学校理工科研究生、计算机相关专业高年级本科生相关专业课教材,也可供行业AI大模型系统开发人员参考。 ”
目錄
第1章AI大模型概述1
1.1AI大模型的定义1
1.2AI大模型发展概况2
1.2.1语言模型演进3
1.2.2AI大模型家族4
1.2.3国内外AI大模型研究现状5
1.3AI大模型基础设施7
1.3.1计算资源8
1.3.2存储系统8
1.3.3网络带宽8
1.3.4AI算法和优化技术9
第2章AI基础算法10
2.1AI基础算法概述10
2.1.1基于集合论的算法10
2.1.2基于概率统计的算法12
2.1.3基于图论的算法14
2.1.4基于空间几何的算法17
2.1.5基于演化计算的算法17
2.1.6基于人工神经网络的算法19
2.2专家系统19
2.2.1专家系统的一般结构20
2.2.2专家系统的构建21
2.2.3专家系统的发展21
2.3机器学习25
2.4拟人机器学习30
2.4.1拟人机器学习的概念30
2.4.2拟人系统的瓶颈问题302.5人工情感计算30
2.5.1文本情感计算31
2.5.2语音情感计算32
2.5.3视觉情感计算33
第3章深度学习技术与工具35
3.1词向量模型35
3.1.1滑动窗口36
3.1.2Word2Vec模型36
3.1.3Word2Vec训练流程41
3.2卷积神经网络43
3.2.1卷积神经网络结构43
3.2.2卷积神经网络的特点46
3.2.3卷积神经网络在自然语言处理领域中的应用47
3.3循环神经网络48
3.3.1典型的循环神经网络单向传播48
3.3.2双向循环神经网络50
3.3.3深度循环神经网络50
3.3.4循环神经网络的主要应用领域53
第4章生成式模型54
4.1混合高斯模型54
4.2隐马尔可夫模型56
4.2.1隐马尔可夫模型的定义56
4.2.2隐马尔可夫模型的表示57
4.2.3隐马尔可夫模型的使用58
4.2.4维特比算法59
4.3受限玻尔兹曼机60
4.3.1受限玻尔兹曼机模型结构60
4.3.2配分函数61
4.4深度置信网络63
4.4.1深度置信网络模型结构63
4.4.2深度置信网络的目标函数64
4.4.3深度置信网络的训练64
4.5Seq2Seq生成模型65
4.5.1语义向量只作为初始状态参与运算65
4.5.2语义向量参与解码的全过程66
4.5.3循环神经网络输出层使用激活函数67
4.5.4Seq2Seq模型的训练过程68
4.6变分自编码器69
4.6.1变分自编码器模型结构69
4.6.2变分下界的求法70
4.6.3重参数化70
4.7生成对抗网络71
4.7.1生成对抗网络的基本原理72
4.7.2生成对抗网络的训练方法72
4.7.3深度卷积生成对抗网络73
4.7.4基于残差网络的结构73
〖3〗AI大模型系统开发技术目录〖3〗第5章数据标注技术76
5.1数据标注的定义与分类76
5.1.1标注的分类76
5.1.2数据标注的应用场景78
5.1.3数据标注的任务79
5.2数据标注的流程及工具80
5.2.1标注流程80
5.2.2标注内容81
5.2.3标注工具81
5.3数据标注实例——情感分析82
5.3.1情感分析概述82
5.3.2情感分析中的数据标注83
第6章注意力机制85
6.1注意力模型86
6.1.1引入注意力的编码器解码器框架86
6.1.2注意力的基本原理87
6.2自注意力机制90
6.2.1单输出90
6.2.2自注意力操作过程92
6.3多头自注意力机制94
6.3.1单输入多头注意力94
6.3.2多输入多头注意力95
6.3.3位置编码96
6.3.4残差连接方法96
6.4多类别注意力机制98
6.4.1空间注意力机制98
6.4.2通道注意力机制98
6.4.3空间和通道注意力机制的融合99
第7章Transformer架构解析101
7.1Transformer的原始框架101
7.2输入输出嵌入层102
7.2.1BPE算法103
7.2.2位置编码103
7.3编码部分104
7.3.1掩码张量104
7.3.2Transformer 的自注意力模块105
7.3.3Transformer 的多头注意力机制107
7.3.4前馈连接层107
7.3.5规范化层108
7.3.6残差连接109
7.4解码部分109
7.4.1解码器的作用109
7.4.2解码器多头注意力机制109
7.5输出处理层110
第8章自然语言处理中的预训练模型112
8.1预训练模型概述112
8.1.1预训练模型的结构113
8.1.2预训练模型压缩技术114
8.1.3预训练任务115
8.1.4多模态预训练模型115
8.2预训练模型适应下游任务116
8.2.1迁移学习116
8.2.2模型迁移方法117
8.3预训练模型在自然语言处理任务中的应用118
8.3.1一般评价基准118
8.3.2问答118
8.3.3情感分析118
8.3.4命名实体识别119
8.3.5机器翻译119
8.3.6摘要119
8.3.7对抗检测和防御119
8.4预训练语言模型GPT120
8.5预训练语言模型BERT120
8.5.1BERT模型结构121
8.5.2嵌入操作层121
8.5.3编码层122
8.5.4预测层122
8.6大模型部署122
8.6.1大模型部署框架122
8.6.2大模型部署步骤123
8.6.3大模型部署方式123
第9章微调技术124
9.1微调概述124
9.2微调神经网络的方法125
9.3自适应微调126
9.4提示学习126
9.4.1提示学习微调模型的基本组成126
9.4.2提示学习微调流程127
9.5增量微调模型128
9.6基于提示的微调129
第10章大语言模型系统安全技术135
10.1大语言模型面临的安全挑战135
10.1.1大语言模型应用面临的威胁135
10.1.2对抗攻击的类型137
10.2大语言模型应用的安全核心组成138
10.2.1数据安全138
10.2.2模型安全138
10.2.3基础设施安全138
10.2.4伦理道德138
10.3大语言模型的对抗攻击与防御139
10.3.1建立安全框架139
10.3.2建设大语言模型应用安全开发策略139
10.3.3大语言模型应用防护方案141
10.3.4应对攻击的策略141
10.3.5大语言模型部署过程中的安全防御策略142
思考题144
附录ABERT源码分析145
参考文献155
內容試閱
人工智能(AI)的研究可以追溯到20世纪中叶,当时的研究者试图通过模拟人类智能解决问题。然而,早期的AI系统由于计算能力和数据的限制,功能较为有限。进入21世纪后,得益于计算能力的提升和大数据的广泛应用,机器学习尤其是深度学习迅速崛起。2012年,AlexNet在ImageNet大赛上取得的突破性成果标志着深度学习时代的到来。随后,谷歌、Facebook、微软等科技巨头相继投入大量资源,推动了AI技术的飞速发展,深刻地改变了人们生活的方方面面。无论是自动驾驶汽车、智能家居设备还是医疗诊断系统,AI的身影无处不在。
AI大模型的出现是AI发展中的一个里程碑。2018年,Google公司推出了BERT模型,它在多个自然语言处理任务上取得了前所未有的成绩。紧随其后,OpenAI公司发布了GPT系列模型,特别是大规模的参数和强大的生成能力,彻底改变了人们对AI的认知。这些大模型在工业界迅速得到应用,涵盖了从文本生成、翻译到编程辅助各个领域。
本书旨在引导读者深入理解和掌握AI大模型开发的关键技术和方法。本书从理论到实践,从算法到工程实现,全面介绍如何系统地构建高效、面向行业的AI大模型系统。本书可作为工科各专业研究生、高年级计算机相关专业本科生、工程师及相关技术开发人员学习AI大模型技术的教材或参考书。考虑非计算机专业的技术人员学习AI技术的需要,本书的第1章对AI大模型进行概要介绍。第2章对AI基础算法进行介绍。第3章对深度学习技术与工具进行介绍。第4~10章系统阐述行业大模型构建、开发相关技术以及预训练大模型的流程等。
本书的写作得到了许多人的帮助和支持。在此,特别感谢那些为AI技术的发展做出贡献的科学家和工程师们。感谢在博客上分享AI大模型研究开发经验的众多研究人员。感谢我的家人和朋友,他们的鼓励和支持是我坚持不懈的动力。此外,感谢所有读者对本书的关注和支持。
作者2025年2月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2025 (香港)大書城有限公司  All Rights Reserved.