登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2025年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書

『簡體書』动手学大模型智能体

書城自編碼: 4182913
分類:簡體書→大陸圖書→計算機/網絡人工智能
作者: 温睦宁 等
國際書號(ISBN): 9787115686381
出版社: 人民邮电出版社
出版日期: 2025-12-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 98.8

我要買

** 我創建的書架 **
未登入.



新書推薦:
《阳明先生年谱》明刻本合集对照
《 《阳明先生年谱》明刻本合集对照 》

售價:HK$ 140.8
女人30+,养气血、调脾胃、防衰老(北京卫视《养生堂》《我是大医生》特邀中医养生专家第七批名老中医沈
《 女人30+,养气血、调脾胃、防衰老(北京卫视《养生堂》《我是大医生》特邀中医养生专家第七批名老中医沈 》

售價:HK$ 61.6
征服新世界:西班牙全球帝国之路,1493—1898
《 征服新世界:西班牙全球帝国之路,1493—1898 》

售價:HK$ 96.8
不纠结了 摆脱选择焦虑的极简法则  高敏感、优柔寡断、总陷入选择内耗的 纠结星人 自救指南
《 不纠结了 摆脱选择焦虑的极简法则 高敏感、优柔寡断、总陷入选择内耗的 纠结星人 自救指南 》

售價:HK$ 54.8
当战争来敲门(牛津二战史,耶鲁、剑桥大学教授推荐)
《 当战争来敲门(牛津二战史,耶鲁、剑桥大学教授推荐) 》

售價:HK$ 96.8
初老的身体:更年期新规则指南(第2版)
《 初老的身体:更年期新规则指南(第2版) 》

售價:HK$ 140.8
摘星星的人
《 摘星星的人 》

售價:HK$ 47.1
名侦探的守则(东野圭吾:反套路!玩梗诡计,吐槽套路,爆笑推理!“你怎么看出我男扮女装的?”)
《 名侦探的守则(东野圭吾:反套路!玩梗诡计,吐槽套路,爆笑推理!“你怎么看出我男扮女装的?”) 》

售價:HK$ 64.9

編輯推薦:
·名家作品:上海交通大学ACM班俞勇教授、博导张伟楠教授又一“动手学”力作。
·配套资源丰富:提供配套课件+理论解读视频+源代码+课后习题+样例数据+提示词模板等
·大咖推荐:陆奇|汪军|安波|谢赛宁等多位业内领军人士推荐
·学用结合:系统梳理大模型智能体的主干知识,搭配丰富的配套资源,兼顾教学与自学需求
內容簡介:
本书系统讲解了大模型智能体的基本内容及其代码实现,是一本着眼于大模型智能体教学实践的教材。
本书包含4个部分:第一部分为智能体基础篇(第1~4章),介绍大模型与智能体以及生成式大语言模型的基础知识、提示工程的技术和实用方法、智能体评估与调试方法;第二部分为智能体架构篇(第5~8章),讲解主流的智能体架构设计、记忆管理与检索增强、工具调用以及推理、规划与树搜索增强核心组件;第三部分为智能体微调篇(第9~11章),主要讨论指令微调、低秩适应微调与模型量化以及强化微调等大模型智能体微调技术;第四部分为智能体前沿篇(第 12~15 章),涉及多模态智能体、多智能体系统、智能体安全以及智能体协议等前沿领域的最新进展。本书将大模型智能体的理论知识和实践操作相结合,以大量示例和代码带领读者系统掌握大模型智能体的研究内容和基本原理,为后续涉足大模型智能体的前沿应用打下基础。
本书适合对大模型智能体感兴趣的专业技术人员和研究人员阅读,同时适合作为高等院校人工智能相关专业中大模型智能体课程的教材。
關於作者:
温睦宁,上海交通大学人工智能学院助理研究员,2025年博士毕业于上海交通大学计算机科学与技术专业。研究方向聚焦于强化学习、大模型智能体以及多智能体系统等方面,拥有丰富的强化学习及智能体系统实践经验。累计发表国际学术论文20余篇,自2022年以来持续担任NeurIPS、ICML、ICLR等国际学术会议审稿人。林江浩,上海交通大学安泰经济与管理学院助理教授,2025年博士毕业于上海交通大学计算机科学与技术专业。研究方向聚焦于生成式人工智能与数据科学,以及此类技术在推荐系统、运筹优化、智能商务等真实场景中的应用。累计发表国际学术论文40余篇,获得两项最佳论文奖,1篇论文入选ESI全球Top 1%高被引论文。张伟楠,上海交通大学教授、博士生导师,ACM班机器学习与强化学习课程授课教师,上海创智学院全时导师。主要研究方向为强化学习、大模型智能体、具身智能。吴文俊人工智能优秀青年奖、达摩院青橙奖得主,主持国家自然科学基金优秀青年科学基金项目和科技部科技创新2030—“新一代人工智能”重大项目课题。俞勇,享受国务院特殊津贴专家,首批“国家高层次人才特殊支持计划”教学名师,上海交通大学特聘教授,上海交通大学ACM班创办人,APEX数据与知识管理实验室主任。曾获得“全国模范教师”“全国师德标兵”“CCF杰出教育奖”“上海市五一劳动奖章”和“上海交通大学校长奖”等荣誉。2018年创办伯禹人工智能学院,在上海交通大学ACM班人工智能专业课程体系的基础上,对人工智能课程体系进行创新,致力于培养卓越的人工智能算法工程师和研究员。2025年创办知春创新中心,探索中学和大学贯通式人才培养模式,打造AI时代创新人才培养“加速器”。
目錄
第 一部分 智能体基础篇

第 1章 初探大模型智能体2
1.1 概述2
1.2 智能体的基本概念2
1.3 智能体的交互机制4
1.3.1 智能体与人的交互4
1.3.2 智能体与环境的交互5
1.4 大模型与智能体的技术融合6
1.5 实践:构建第 一个智能体6
1.6 小结10
第 2章 生成式大语言模型基础11
2.1 概述11
2.2 生成式大语言模型的技术架构11
2.2.1 核心原理与发展历程11
2.2.2 主流模型对比和分析12
2.3 生成式大语言模型的文本生成机制与特性12
2.3.1 词汇表与分词器13
2.3.2 自回归生成原理13
2.3.3 模型特性分析14
2.4 生成式大语言模型的开源模型实践应用15
2.5 生成式大语言模型的生成参数18
2.5.1 温度参数18
2.5.2 采样策略18
2.6 生成式大语言模型的对话系统实践20
2.7 小结23
2.8 参考文献23
第3章 提示工程24
3.1 概述24
3.2 提示工程的定义24
3.3 提示词25
3.3.1 提示词的标准组成28
3.3.2 提示词的设计原则29
3.4 角色扮演策略32
3.5 提示工程技术33
3.5.1 思维链33
3.5.2 上下文学习36
3.5.3 自我一致性37
3.5.4 推理提示37
3.5.5 反思提示38
3.6 提示工程的实用方法39
3.6.1 提示工程调优39
3.6.2 常用的提示词44
3.6.3 提示工程开发实践资源45
3.7 小结45
3.8 参考文献46
第4章 智能体评估与调试47
4.1 概述47
4.2 环境准备与模型部署47
4.3 智能体异常场景48
4.3.1 幻觉现象48
4.3.2 工具调用异常49
4.3.3 推理链错误50
4.4 智能体与聊天机器人的差异50
4.5 智能体的评估方法51
4.5.1 人工测试与用户反馈52
4.5.2 自动化评估与基准数据集测试53
4.5.3 大模型自动评测58
4.6 智能体调试与问题定位60
4.6.1 调试的基本流程和问题定位的常用方法60
4.6.2 典型问题案例分析60
4.7 小结63
4.8 参考文献65

第二部分 智能体架构篇

第5章 智能体架构设计68
5.1 概述68
5.2 智能体架构的核心组件68
5.2.1 记忆模块69
5.2.2 工具调用模块71
5.2.3 复杂推理与规划模块72
5.2.4 执行模块73
5.3 智能体工作流73
5.4 常见的智能体架构模式74
5.4.1 基于提示词的混合决策架构74
5.4.2 规划—执行—反馈架构75
5.4.3 自主循环架构76
5.5 常用的智能体框架77
5.5.1 LangChain:模块化开发的标杆77
5.5.2 LlamaIndex:非结构化数据处理专家77
5.5.3 Haystack:企业级信息检索框架78
5.5.4 常用智能体框架的对比78
5.6 实践:最简智能体架构实现79
5.7 小结87
5.8 参考文献88
第6章 记忆管理与检索增强89
6.1 概述89
6.2 智能体的记忆管理89
6.2.1 记忆管理的必要性89
6.2.2 上下文窗口限制机制90
6.2.3 实验:智能体遗忘现象验证91
6.2.4 记忆管理机制的核心功能93
6.3 短期记忆与长期记忆93
6.3.1 短期记忆机制93
6.3.2 实验:滑动窗口短期记忆实现94
6.3.3 长期记忆机制96
6.3.4 实验:简易长期记忆实现97
6.4 上下文管理100
6.4.1 内容选择101
6.4.2 实验:基于重要性的记忆选择101
6.4.3 摘要提取102
6.4.4 实验:对话摘要生成103
6.5 检索增强生成105
6.5.1 构建知识库106
6.5.2 实验:文档向量化与索引构建107
6.5.3 相似度检索108
6.5.4 基于FAISS的相似度检索实践109
6.5.5 上下文增强110
6.5.6 上下文增强的知识回答实践111
6.5.7 记忆更新机制113
6.6 实用技巧与注意事项114
6.6.1 嵌入模型与向量库选型114
6.6.2 检索干扰与提示工程115
6.6.3 数据隐私与知识库存储策略115
6.7 实践:构建文档问答智能体116
6.8 小结123
6.9 参考文献124
第7章 工具调用125
7.1 概述125
7.2 工具调用的核心流程126
7.3 引入工具的必要性126
7.3.1 大模型的局限性127
7.3.2 能力补全的关键路径127
7.3.3 实验验证128
7.4 常见的工具类型及应用场景130
7.4.1 信息检索类工具130
7.4.2 计算与执行类工具131
7.4.3 设备控制类工具132
7.5 如何选择并使用工具133
7.5.1 工具接口设计133
7.5.2 工具的调用和决策机制135
7.5.3 工具的解析与执行136
7.6 多工具的整合与调度137
7.6.1 多工具的选择策略138
7.6.2 多工具的协作与顺序执行138
7.6.3 工具优先级与回退机制139
7.6.4 多工具调用的策略140
7.7 实践:构建多功能智能体140
7.8 小结144
7.9 参考文献145
第8章 推理、规划与树搜索增强146
8.1 概述146
8.2 智能体推理与规划面临的挑战147
8.2.1 从失败案例看解决推理任务的难点147
8.2.2 思维链151
8.2.3 思维链的局限性151
8.3 智能体任务规划的策略152
8.3.1 规划—执行范式153
8.3.2 子任务分解154
8.3.3 动态调整与反思155
8.4 基于搜索算法的推理增强156
8.4.1 思维树157
8.4.2 自我一致性158
8.4.3 搜索算法结合160
8.5 实践:复杂任务智能体161
8.6 小结175
8.7 参考文献176

第三部分 智能体微调篇

第9章 指令微调178
9.1 概述178
9.2 指令微调的原理178
9.3 数据集准备179
9.3.1 数据的生成方式179
9.3.2 数据的格式181
9.3.3 数据的质量181
9.4 实践:指令微调训练流程182
9.4.1 模型选择和参数设置182
9.4.2 训练流程183
9.4.3 效果评估185
9.5 拓展与实践建议188
9.6 小结188
9.7 参考文献189
第 10章 低秩适应微调与模型量化190
10.1 概述190
10.2 智能体微调的难点191
10.3 LoRA微调的原理191
10.4 LoRA微调实践194
10.4.1 加载模型和分词器194
10.4.2 加载数据集并预处理196
10.4.3 LoRA微调实践198
10.4.4 全参数微调实践201
10.4.5 评估与分析203
10.5 模型量化方法207
10.5.1 8比特量化208
10.5.2 4比特量化211
10.5.3 静态量化与动态量化214
10.6 LoRA微调结合模型量化实践215
10.7 小结223
10.8 参考文献225
第 11章 强化微调226
11.1 概述226
11.2 强化微调与传统强化学习的对比227
11.3 将文本生成建模为马尔可夫决策过程227
11.4 传统强化学习基础228
11.4.1 价值优化与策略优化228
11.4.2 Actor-Critic架构与PPO算法229
11.5 强化微调经典方法与扩展230
11.5.1 基于人类反馈的强化学习230
11.5.2 群组相对策略优化231
11.5.3 扩展技术:DAPO与VAPO231
11.6 奖励函数设计232
11.6.1 常见的奖励形式232
11.6.2 过程奖励与结果奖励232
11.6.3 奖励设计的原则233
11.7 基于VeRL框架的强化微调实践233
11.8 小结239
11.9 参考文献240

第四部分 智能体前沿篇

第 12章 多模态智能体242
12.1 概述242
12.2 多模态输入与理解242
12.2.1 以文本为介质的多模态理解243
12.2.2 原生多模态理解244
12.3 多模态行为246
12.4 实践:GUI智能体——手机个人助手247
12.5 小结251
12.6 参考文献251
第 13章 多智能体系统252
13.1 概述252
13.2 多智能体的协作模式253
13.3 典型架构与代表性工作254
13.3.1 通信模式255
13.3.2 系统架构255
13.3.3 智能体的专业化策略256
13.3.4 代表性项目256
13.4 多智能体系统的应用257
13.4.1 软件开发自动化257
13.4.2 内容创作与营销257
13.4.3 科研与学术论文写作258
13.5 实践:构建基于大模型的多智能体系统259
13.6 小结262
13.7 参考文献263
第 14章 智能体安全264
14.1 概述264
14.2 智能体攻击265
14.2.1 直接提示词注入266
14.2.2 间接提示词注入268
14.2.3 认知黑客/任务劫持攻击269
14.3 智能体防御273
14.3.1 输入/输出过滤与净化273
14.3.2 工具使用确认与规划限制275
14.3.3 指令微调与加固278
14.4 实践:智能体红蓝对抗实验278
14.4.1 蓝队:构建智能体279
14.4.2 红队:构造恶意文章280
14.4.3 开始对抗过程280
14.5 小结281
14.6 参考文献282
第 15章 智能体协议283
15.1 概述283
15.2 智能体协议的分类284
15.2.1 模型上下文协议284
15.2.2 A2A协议286
15.3 智能体协议的评估维度287
15.3.1 高效性288
15.3.2 性能扩展性289
15.3.3 功能扩展性289
15.4 实践:基于MCP的智能体助手290
15.5 小结295
15.6 参考文献296

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2026 (香港)大書城有限公司  All Rights Reserved.