新書推薦:

《
中国早期城市与文明起源 一部中国早期城市发展简史,解读城市与文明交织共生的规律
》
售價:HK$
96.8

《
只要我还在创作 角谷美智子访谈录
》
售價:HK$
74.8

《
国医大师邓铁涛 治未病从孩子抓起 中医治未病 二十四节气顺时调养 常见病预防 中医健康体检 广东科技
》
售價:HK$
54.9

《
英国都铎王朝君主形象塑造与政治文化变迁
》
售價:HK$
184.8

《
从一道高三数学模拟测试题的背景谈起:兼谈等周问题与等周不等式
》
售價:HK$
74.8

《
《仪礼》版本研究:全三册
》
售價:HK$
383.9

《
水浒传绘本 全8册 水浒桥梁书 同步原著改编去暴力 萌趣卡通国风画卷 文史科普趣味拓展
》
售價:HK$
228.8

《
中国清代戏曲史上、下卷(套装2册)
》
售價:HK$
437.8
|
| 編輯推薦: |
本书的亮点在于三个关键词——前瞻、系统和实用!这三者其实很难统一起来了,都说书如其人,本书作者的特质决定了这本书能很好将这三者统一起来,他非常擅长将前沿 AI 研究进行商业落地。 l 其中,我认为最大的亮点在于其前瞻的视野,本书大胆切入当前最炙手可热的前沿领域——让智能体具备像生命体一样的“自进化”能力,以及作为服务长期稳定运行的“持续运行”能力。这部分内容代表了技术的未来,能极大地拓展读者的技术视野,抢占未来发展先机。 l 而对于系统,本书没有停留在对智能体概念的泛泛而谈,而是将其拆解为感知、工具、推理规划、记忆、反思、动作七大核心系统,并逐一深入剖析。 l 这些必须“学以致用”,因此,书中不仅融合了强化学习、评估体系等优化方法论,更在最后以“自动化求职智能体”为蓝本,给出了一个详尽的、可参考的实战案例。这对于希望将先进理论转化为实际解决方案的工程师和开发者而言,价值非凡。 当智能体拥有记忆与反思能力,AI将不再是工具,而是进化伙
|
| 內容簡介: |
人工智能正经历从“被动应答”到“主动行动”的范式变革,智能体(Agent)作为实现这一跨越的核心载体,已成为技术研究与产业应用的新焦点。本书旨在为读者提供一份穿越这一前沿领域的全面导航图。本书系统性地构建了智能体的完整知识体系,不仅深入剖析了智能体的七大核心架构组件——感知、工具、推理规划、记忆、反思、动作系统及其协同机制,还前瞻性地探讨了如何利用强化学习优化智能体决策、如何构建科学的评估体系以弥合“评估鸿沟”,并详细阐述了自进化智能体与持续运行智能体这两大前沿方向,揭示了智能体如何实现自我优化与长期自治。全书理论结合实践,最终通过“自动化求职智能体”这一完整案例,将抽象理论落地为具体实现。來源:香港大書城megBookStore,http://www.megbook.com.hk 本书是一本前瞻性强、实用参考价值高、专业且全面的智能体技术综合性参考教程,既适合AI工程师、开发者等专业人士提升技术能力,也能帮助产品经理、技术决策者把握智能体应用场景,同时为高校师生和技术爱好者提供前沿学习资料。
|
| 關於作者: |
张益新
资深人工智能专家,Google机器学习开发专家(GDE)。
具有8年一线算法工程经验,专长于将前沿AI研究转化为商业落地解决方案。
经验覆盖零售、芯片、自动驾驶等多个行业,深入理解不同领域的人工智能落地挑战。
曾在初创团队及大型企业环境中,成功推动核心项目的技术部署与持续迭代,相关产品曾展示给国家总理。
带队参加哈佛大学发起的NeurIPS 2025 CURE-Bench竞赛,从全球322支参赛队伍中脱颖而出,获得亚军。
谢婷婷
资深算法研究员,伦敦玛丽女王大学博士,曾任商汤科技研究员。
学术研究方向聚焦于少样本学习与时序信息理解。
长期担任CVPR、ECCV、ICCV、AAAI等会议审稿人,获CVPR 2025、ECCV 2022杰出审稿人荣誉。
作为核心成员参与多个大模型研发项目,主导完成商汤大语言模型“商量”粤语版的开发与交付。
带队参加哈佛大学发起的NeurIPS 2025 CURE-Bench竞赛,从全球322支参赛队伍中脱颖而出,获得亚军。
|
| 目錄:
|
第1章 智能体基础概念 001
1.1 背景与定义 001
1.1.1 背景 001
1.1.2 定义 005
1.1.3 智能体与传统程序、模型、大语言模型、工作流 007
1.1.4 智能体的发展路线 010
1.2 智能体系统 = 大语言模型 + 工具 + 编排层 011
1.2.1 智能体系统的概念与架构 011
1.2.2 智能体系统的分类:从简单反应到复杂认知 014
1.3 什么时候需要构建智能体 026
1.3.1 智能体适用的场景 026
1.3.2 智能体不适用的场景 028
1.4 总结 030
第2章 感知系统 032
2.1 感知表示的类型 035
2.1.1 单模态模型 036
2.1.2 跨模态模型 039
2.1.3 多模态模型 041
2.2 优化感知系统 043
2.2.1 模型级增强 044
2.2.2 系统级优化 045
2.2.3 外部反馈和控制 045
2.3 感知应用 046
2.4 总结 047
第3章 工具系统 049
3.1 智能体工具的价值定位与能力边界 050
3.1.1 价值定位:认知增益空间 050
3.1.2 能力边界:细节处理与战略洞察 051
3.2 智能体工具发现:基于MCP的分类与扩展体系 052
3.2.1 MCP下的工具分类框架 053
3.2.2 MCP工具调用生态架构 056
3.2.3 工具选型策略与典型场景 057
3.3 智能体工具使用评估 058
3.3.1 挑战:工具过度使用 059
3.3.2 解决思路:元认知与自我意识 059
3.3.3 工具调用时机判断:从理论到实践的关键挑战 060
3.3.4 评估方法与基准 061
3.4 智能体工具链设计原则 062
3.4.1 模块化设计原则 062
3.4.2 可扩展性设计 063
3.4.3 容错与恢复机制 063
3.4.4 安全性 064
3.5 总结 064
第4章 推理规划决策系统 066
4.1 推理基础 067
4.1.1 逻辑推理 067
4.1.2 概率推理 068
4.1.3 因果推理 070
4.2 规划算法 071
4.2.1 增强智能体规划能力的策略 072
4.2.2 多智能体框架与规划智能体 075
4.2.3 智能体规划实施流程 076
4.2.4 智能体规划与强化学习的深度融合 078
4.3 决策策略 082
4.3.1 多目标决策 082
4.3.2 不确定性处理 082
4.3.3 实时决策优化 082
4.4 总结 083
第5章 记忆系统 085
5.1 智能体记忆概述 085
5.1.1 智能体记忆的演进 086
5.1.2 类比人类认知:记忆功能的启示 086
5.2 智能体记忆的基础架构与机制 088
5.2.1 智能体记忆的分类 089
5.2.2 实现记忆的关键技术 092
5.3 智能体记忆开源项目概览 094
5.3.1 基础框架:构建具备记忆能力的智能体的基石 094
5.3.2 专业化与创新记忆系统 095
5.3.3 新兴记忆技术与实验性框架 095
5.4 高级智能体记忆的应用 096
5.4.1 会话智能体的记忆增强 096
5.4.2 机器人认知与空间记忆 097
5.4.3 驱动个性化推荐系统 098
5.4.4 创造更可信和自适应的游戏智能体 098
5.5 核心挑战、风险与缓解策略 098
5.6 未来方向与新兴研究前沿 099
5.6.1 向多模态与流式记忆的推进 100
5.6.2 开发全面共享和持续演进的记忆架构 100
5.6.3 自适应记忆管理机制 100
5.6.4 记忆驱动的通用智能演进 101
5.7 总结 101
第6章 反思系统 103
6.1 智能体反思机制的理论基础 104
6.1.1 认知科学视角 105
6.1.2 元认知与自我监控 105
6.1.3 学习理论 106
6.2 智能体反思技术实现 107
6.2.1 反思框架 107
6.2.2 自我批评机制 110
6.2.3 迭代方法 110
6.2.4 记忆整合 111
6.3 智能体反思应用场景 112
6.3.1 复杂问题解决 112
6.3.2 推理能力增强优化 113
6.3.3 规划与决策优化 113
6.3.4 从错误中学习 114
6.4 智能体反思案例研究 115
6.4.1 ReAct 115
6.4.2 Reflexion 116
6.4.3 Self-Refine 116
6.5 智能体反思的未来展望 117
6.5.1 挑战与限制 117
6.5.2 研究方向 118
6.5.3 伦理考量 120
6.6 总结 121
第7章 动作系统 123
7.1 智能体动作系统的理论基础 123
7.1.1 哲学思辨:动作理论的启示 124
7.1.2 计算建模:基于智能体的模型 124
7.1.3 认知架构:构建智能体动作系统的蓝图 124
7.2 动作的选择与决策 127
7.2.1 动作选择策略与方法 127
7.2.2 强化学习:塑造智能体动作与策略的关键 128
7.2.3 模仿学习:从模仿中习得动作系统运作方式 128
7.2.4 动作系统的层次结构 129
7.2.5 动作系统的核心组件 130
7.2.6 动作系统的工作流程 131
7.3 智能体动作系统类型及其表现 133
7.3.1 反应式动作系统与审议式动作系统 133
7.3.2 单智能体动作系统与多智能体交互 134
7.3.3 具身智能体的动作系统:与物理及虚拟环境的互动 135
7.3.4 不同领域的动作系统特点 135
7.4 前沿进展与未来展望 137
7.4.1 智能体动作系统的可解释性与可信度 137
7.4.2 复杂智能体动作系统建模与评估的挑战 137
7.4.3 智能体动作系统的优化策略 138
7.4.4 智能体动作系统的安全机制 138
7.4.5 未来研究方向建议 139
7.5 总结 140
第8章 强化学习 141
8.1 基础理论 141
8.1.1 马尔可夫决策过程 141
8.1.2 奖励机制设计 142
8.1.3 价值函数 143
8.2 从人类奖励到智能体奖励 145
8.3 强化学习中的奖励机制 146
8.3.1 奖励模型定义 146
8.3.2 外部奖励 146
8.3.3 内部奖励 147
8.3.4 混合奖励 147
8.3.5 层级奖励 148
8.4 人类反馈强化学习 148
8.4.1 RLHF框架 148
8.4.2 偏好学习 149
8.4.3 在线学习与持续优化 150
8.5 强化学习算法实现——OpenPipe ART 151
8.5.1 群体强化策略优化 151
8.5.2 群体序列策略优化 153
8.5.3 相对通用大语言模型引导奖励 155
8.5.4 ART框架的架构与实现 157
8.5.5 MCP·RL:协议级强化学习 159
8.5.6 实际应用案例 159
8.6 挑战与未来发展方向 160
8.7 总结 162
第9章 评估系统 163
9.1 智能体评估的关键维度与能力 164
9.1.1 基础能力评估:规划、工具使用、自我反思与记忆 164
9.1.2 特定应用领域智能体评估 165
9.2 科学评估体系的构建 166
9.2.1 主观评估失效的典型案例 166
9.2.2 科学评估体系的构建方法论 167
9.3 智能体主流评估基准与框架 168
9.4 可信性评估 169
9.5 总结 170
第10章 自进化智能体 171
10.1 自进化智能体的理论基础 172
10.1.1 认知科学视角 172
10.1.2 自进化的核心机制 175
10.2 自进化智能体的优化空间与维度 180
10.2.1 自进化的提示优化 180
10.2.2 自进化的工作流优化 182
10.2.3 自进化的工具优化 183
10.3 自进化智能体架构 184
10.3.1 组件化与模块化设计 185
10.3.2 数据驱动的自进化框架 186
10.3.3 脑启发式架构 187
10.4 科学知识发现中的自进化智能体 188
10.5 自进化智能体的技术的挑战与解决方案 190
10.5.1 现实世界交互挑战 190
10.5.2 复杂推理挑战 192
10.5.3 先验知识整合挑战 195
10.6 自进化智能体应用领域与案例研究 196
10.7 未来展望与发展趋势 197
10.8 总结 198
第11章 持续运行智能体 200
11.1 持续运行智能体的价值 201
11.1.1 持续运行智能体的状态依赖性与中断代价 201
11.1.2 持续运行智能体的优势 202
11.2 持续运行智能体的定义与运行机制 203
11.2.1 持续运行智能体的核心定义与特征 204
11.2.2 后台运行与循环机制 204
11.2.3 条件触发与反馈循环 208
11.3 持续运行智能体的挑战与应对机制 213
11.3.1 持续运行智能体面临的挑战 214
11.3.2 持续运行智能体的应对机制 219
11.4 持续运行智能体LangGraph实现 223
11.4.1 LangGraph持久化机制的技术实现 224
11.4.2 错误恢复与容错机制 226
11.4.3 持续运行的方法论与最佳实践 229
11.5 持续运行智能体的评估指标 232
11.5.1 评估指标体系 232
11.5.2 基准测试与对比实验 234
11.6 总结 236
第12章 自动化求职智能体 237
12.1 背景介绍 237
12.2 技术框架 238
12.3 项目准备 238
12.3.1 前置准备与环境配置 238
12.3.2 代码详解:求职自动化脚本 240
12.3.3 运行演示脚本与成果展示 251
12.4 核心概念解析 252
12.5 可扩展方向 253
12.6 总结 254
|
| 內容試閱:
|
人工智能领域近年来飞速发展,以GPT-4、Claude、Gemini等为代表的大语言模型的横空出世,无疑为我们描绘了机器智能的新蓝图。这些模型在文本理解、内容生成乃至初步的逻辑推理上均展现出卓越能力。然而,它们在本质上仍扮演着“被动响应者”的角色,缺乏主动感知环境、持续交互并自主行动的能力。正是这一关键能力的“缺失”,为更高级的智能形态——智能体的登场,打造了绝佳的舞台。 智能体作为AI领域令人兴奋的前沿技术,正迅速从理论走向实践,展现出重塑行业的巨大潜力。从自动化执行复杂任务到提供个性化服务,再到在动态环境中进行自主决策,智能体的能力边界不断拓展。特别是大语言模型的崛起,为构建更强大、更智能的智能体提供了坚实的基础。然而,如何系统地理解和构建这些具备自主学习、规划、记忆与反思能力的复杂系统,仍然是开发者和研究者面临的重要课题。 我们正站在AI智能体技术大爆发的历史关口。多种关键技术的成熟与交汇,如同百川归海,共同催生了新一代智能体的崛起浪潮。 l大语言模型能力的飞跃:大语言模型日益强大的理解、推理与生成能力,为智能体提供了前所未有的“智慧大脑”。 l工具调用范式的成熟:从学术性的工具学习(Tool Learning)到工程化的函数调用(Function Calling),大语言模型已具备调用外部工具、拓展自身能力的“灵巧手脚”。 l记忆系统的革新:向量数据库与结构化存储技术的进步,赋予了智能体更持久、更高效的“记忆宫殿”。 l强化学习的持续突破:从AlphaGo的惊艳到Decision Transformer的探索,智能体通过与环境的试错交互,获得了持续优化自身行为的“进化引擎”。 l分布式系统的坚实支撑:云计算、边缘计算等基础设施的完善,为智能体的高效运行与广泛部署提供了“广阔天地”。 从信息论、控制论与系统论的宏观视角审视,智能体的崛起并非偶然,而是一场由多项底层技术突破、累积、叠加,最终引发的“集束式爆发”与临界演进,表现为模型能力的认知跨越、控制系统的行动闭环,以及系统结构的架构升级。这意味着,人工智能正从静态的“问答机”蜕变为具备主动性、目标感与环境适应能力的智能行动者,为下一代人机交互乃至整个数字世界的形态,开辟了充满想象力的新图景。 当前,关于智能体的讨论和研究呈现出爆发式增长的态势。我们观察到,无论是学术界还是工业界,都对智能体的理论基础、核心技术、架构设计及实践应用抱有浓厚兴趣。然而,系统性地梳理智能体领域知识,特别是将感知、工具、推理规划、记忆、反思、动作等核心组件与强化学习、评估系统、自主进化等前沿技术结合,并提供从基础到应用的完整实践指导的资料尚不多见。 无论是站在技术、理论,还是应用的角度,都希望本书成为你理解与掌握下一代智能体系统的“导航星图”。 面对这一技术浪潮与行业需求,本书旨在填补系统性知识的空白,从智能体的基础概念出发,系统性地构建完整的智能体技术体系。全书涵盖智能体的核心架构组件(感知系统、工具系统、推理规划决策系统、记忆系统、反思系统、动作系统),探讨了强化学习在智能体优化中的应用,分析智能体评估方法与指标体系,并重点阐述自进化智能体和持续运行智能体的前沿技术,最终通过典型应用案例和核心技术挑战分析,为读者提供从理论基础到实践应用的完整知识框架。 本书主要内容 本书系统地介绍了智能体技术体系,从基础概念到前沿应用,涵盖核心架构组件、关键技术实现、评估方法体系,以及实际应用案例。全书共分为12个章节,内容安排如下。 l第1章:智能体基础概念。详细阐述智能体的背景与定义、智能体系统的基本组成要素(大语言模型+工具+编排层),以及智能体的适用场景。 l第2章:感知系统。深入探讨智能体如何通过多模态传感器接收环境信息,构建准确的世界模型,以及感知系统在智能体决策中的关键作用。 l第3章:工具系统。系统梳理智能体工具的定义、分类、使用方法及评估体系,重点关注如何构建集成多种专用分析工具的工具箱。 l第4章:推理规划决策系统。探讨智能体在复杂动态环境中的规划能力,包括基础理论、规划算法、决策策略。 l第5章:记忆系统。研究智能体记忆系统的构建、管理与优化,探讨短期记忆与长期记忆的实现技术,以及记忆系统对连续学习和个性化交互的支持。 l第6章:反思系统。分析智能体反思机制的理论基础和技术实现,探讨反思机制如何帮助智能体从经验中学习,提高问题解决和决策能力。 l第7章:动作系统。研究智能体如何将内部决策转化为外部行动,探讨“感知—决策—动作”循环在智能体与环境交互中的核心作用。 l第8章:强化学习。聚焦强化学习如何驱动智能体的自主学习和决策优化,包括奖励机制设计、策略学习和环境交互。 l第9章:评估系统。讨论智能体系统的评估方法和指标体系,解决当前智能体评估面临的“评估鸿沟”问题。 l第10章:自进化智能体。探讨具备自主学习、自我优化和持续演进能力的智能体系统,分析其核心特征和实现机制。 l第11章:持续运行智能体。深入研究智能体系统的持续运行能力,包括长期稳定持续运行、不间断服务保障和自适应容错恢复能力。 l第12章:自动化求职智能体。通过具体的应用案例,展示智能体在自动化求职场景中的实际应用和技术实现。 本书适合哪些读者 本书适合以下读者群体参考阅读。 lAI开发者与工程师:从智能体基础概念到核心架构组件的完整技术指南,涵盖感知、工具、推理规划、记忆、反思、动作等系统实现。 l研究人员与学生:系统性的智能体理论知识与最新研究成果,包括强化学习、自主进化、持续运行等前沿技术。 l产品经理与创业者:理解智能体技术体系和应用场景,把握智能体在不同领域的商业化潜力。 l系统架构师:深入了解智能体系统架构设计、评估方法,以及典型应用案例的技术实现。 此外,我们特别推荐有以下专业背景的读者关注本书。 l机器学习研究人员:深入了解强化学习在智能体优化中的应用,以及自主进化智能体的学习机制。 l认知科学研究人员:探索智能体的感知、记忆、反思等认知模块与人类认知的对应关系。 l软件工程师:学习智能体系统的持续运行机制、容错处理,以及典型应用的工程实现。 l评估与测试专家:掌握智能体评估体系、指标设计,以及性能测试方法。 如何阅读本书 本书采用从基础到前沿、从理论到应用的渐进式结构设计。我们建议读者: l基础阶段(第1~3章):建立智能体基础概念,理解感知系统和工具系统的核心原理,为后续学习奠定基础。 l核心架构阶段(第4~7章):深入学习推理规划决策、记忆、反思、动作等核心系统,掌握智能体的完整架构体系。 l优化与评估阶段(第8~9章):了解强化学习在智能体优化中的应用,掌握智能体评估的方法与指标体系。 l前沿技术阶段(第10~11章):探索自进化智能体和持续运行智能体的前沿技术与实现机制。 l应用实践阶段(第12章):通过具体应用案例和技术挑战分析,将理论知识转化为实践能力。 对于不同背景的读者,可以根据需求选择重点章节:技术开发者重点关注架构实现章节,研究人员可深入前沿技术部分,产品经理可重点阅读应用案例章节。阅读本书需要读者具备基本的计算机科学知识和人工智能知识,熟悉Python编程将有助于理解技术实现细节。 致谢 本书的完成离不开AI领域众多前辈和同行的卓越贡献,他们的研究成果和开源贡献为我们提供了坚实的理论基础和丰富的实践素材。在此,我们向所有致力于推动AI技术发展的研究人员、工程师和开源社区贡献者表示衷心的感谢。同时,也感谢在本书撰写过程中给予我们宝贵意见和建议的专家学者与早期读者。
本书代码示例主要基于国际通用的大模型API,国内读者可将其无缝替换为通义千问、DeepSeek等国产大模型的API,原理完全通用。
|
|