自进化智能体：动态记忆与持续运行的架构实践

编号:: wx1204282923

销售价:: ￥75.24; (市场价: ~~￥99.00~~)

赠送积分:: 75

数量:: 件

商品介绍
商品参数
商品评论
商品咨询

商品介绍

人工智能正经历从“被动应答”到“主动行动”的范式变革，智能体（Agent）作为实现这一跨越的核心载体，已成为技术研究与产业应用的新焦点。本书旨在为读者提供一份穿越这一前沿领域的全面导航图。本书系统性地构建了智能体的完整知识体系。它不仅深入剖析了智能体的七大核心架构组件――感知、工具、推理规划、记忆、反思、动作系统及其协同机制，还前瞻性地探讨了如何利用强化学习优化智能体决策、如何构建科学的评估体系以弥合“评估鸿沟”，并详细阐述了自进化智能体与持续运行智能体这两大前沿方向，揭示了智能体如何实现自我优化与长期自治。全书理论结合实践，最终通过“自动化求职智能体”这一完整案例，将抽象理论落地为具体实现。

张益新资深人工智能专家，Google机器学习开发专家（GDE）。具有8年一线算法工程经验，专长于将前沿AI研究转化为商业落地解决方案。经验覆盖零售、芯片、自动驾驶等多个行业，深入理解不同领域的人工智能落地挑战。曾在初创团队及大型企业环境中，成功推动核心项目的技术部署与持续迭代，相关产品曾展示给国家总理。带队参加哈佛大学发起的NeurIPS 2025 CURE-Bench竞赛，从全球322支参赛队伍中脱颖而出，获得亚军。谢婷婷资深算法研究员，伦敦玛丽女王大学博士，曾任商汤科技研究员。学术研究方向聚焦于少样本学习与时序信息理解。长期担任CVPR、ECCV、ICCV、AAAI等顶级会议审稿人，获CVPR 2025、ECCV 2022杰出审稿人荣誉。作为核心成员参与多个大模型研发项目，主导完成商汤大语言模型“商量”粤语版的开发与交付。带队参加哈佛大学发起的NeurIPS 2025 CURE-Bench竞赛，从全球322支参赛队伍中脱颖而出，获得亚军。

第1章智能体基础概念 001
1.1 背景与定义 001
1.1.1 背景 001
1.1.2 定义 005
1.1.3 智能体与传统程序、模型、大语言模型、工作流 007
1.1.4 智能体的发展路线 010
1.2 智能体系统 = 大语言模型 + 工具 + 编排层 011
1.2.1 智能体系统的概念与架构 011
1.2.2 智能体系统的分类：从简单反应到复杂认知 014
1.3 什么时候需要构建智能体 026
1.3.1 智能体适用的场景 026
1.3.2 智能体不适用的场景 028
1.4 总结 030
第2章感知系统 032
2.1 感知表示的类型 035
2.1.1 单模态模型 036
2.1.2 跨模态模型 039
2.1.3 多模态模型 041
2.2 优化感知系统 043
2.2.1 模型级增强 044
2.2.2 系统级优化 045
2.2.3 外部反馈和控制 045
2.3 感知应用 046
2.4 总结 047
第3章工具系统 049
3.1 智能体工具的价值定位与能力边界 050
3.1.1 价值定位：认知增益空间 050
3.1.2 能力边界：细节处理与战略洞察 051
3.2 智能体工具发现：基于MCP的分类与扩展体系 052
3.2.1 MCP下的工具分类框架 053
3.2.2 MCP工具调用生态架构 056
3.2.3 工具选型策略与典型场景 057
3.3 智能体工具使用评估 058
3.3.1 挑战：工具过度使用 059
3.3.2 解决思路：元认知与自我意识 059
3.3.3 工具调用时机判断：从理论到实践的关键挑战 060
3.3.4 评估方法与基准 061
3.4 智能体工具链设计原则 062
3.4.1 模块化设计原则 062
3.4.2 可扩展性设计 063
3.4.3 容错与恢复机制 063
3.4.4 安全性 064
3.5 总结 064
第4章推理规划决策系统 066
4.1 推理基础 067
4.1.1 逻辑推理 067
4.1.2 概率推理 068
4.1.3 因果推理 070
4.2 规划算法 071
4.2.1 增强智能体规划能力的策略 072
4.2.2 多智能体框架与规划智能体 075
4.2.3 智能体规划实施流程 076
4.2.4 智能体规划与强化学习的深度融合 078
4.3 决策策略 082
4.3.1 多目标决策 082
4.3.2 不确定性处理 082
4.3.3 实时决策优化 082
4.4 总结 083
第5章记忆系统 085
5.1 智能体记忆概述 085
5.1.1 智能体记忆的演进 086
5.1.2 类比人类认知：记忆功能的启示 086
5.2 智能体记忆的基础架构与机制 088
5.2.1 智能体记忆的分类 089
5.2.2 实现记忆的关键技术 092
5.3 智能体记忆开源项目概览 094
5.3.1 基础框架：构建具备记忆能力的智能体的基石 094
5.3.2 专业化与创新记忆系统 095
5.3.3 新兴记忆技术与实验性框架 095
5.4 高级智能体记忆的应用 096
5.4.1 会话智能体的记忆增强 096
5.4.2 机器人认知与空间记忆 097
5.4.3 驱动个性化推荐系统 098
5.4.4 创造更可信和自适应的游戏智能体 098
5.5 核心挑战、风险与缓解策略 098
5.6 未来方向与新兴研究前沿 099
5.6.1 向多模态与流式记忆的推进 100
5.6.2 开发全面共享和持续演进的记忆架构 100
5.6.3 自适应记忆管理机制 100
5.6.4 记忆驱动的通用智能演进 101
5.7 总结 101
第6章反思系统 103
6.1 智能体反思机制的理论基础 104
6.1.1 认知科学视角 105
6.1.2 元认知与自我监控 105
6.1.3 学习理论 106
6.2 智能体反思技术实现 107
6.2.1 反思框架 107
6.2.2 自我批评机制 110
6.2.3 迭代方法 110
6.2.4 记忆整合 111
6.3 智能体反思应用场景 112
6.3.1 复杂问题解决 112
6.3.2 推理能力增强优化 113
6.3.3 规划与决策优化 113
6.3.4 从错误中学习 114
6.4 智能体反思案例研究 115
6.4.1 ReAct 115
6.4.2 Reflexion 116
6.4.3 Self-Refine 116
6.5 智能体反思的未来展望 117
6.5.1 挑战与限制 117
6.5.2 研究方向 118
6.5.3 伦理考量 120
6.6 总结 121
第7章动作系统 123
7.1 智能体动作系统的理论基础 123
7.1.1 哲学思辨：动作理论的启示 124
7.1.2 计算建模：基于智能体的模型 124
7.1.3 认知架构：构建智能体动作系统的蓝图 124
7.2 动作的选择与决策 127
7.2.1 动作选择策略与方法 127
7.2.2 强化学习：塑造智能体动作与策略的关键 128
7.2.3 模仿学习：从模仿中习得动作系统运作方式 128
7.2.4 动作系统的层次结构 129
7.2.5 动作系统的核心组件 130
7.2.6 动作系统的工作流程 131
7.3 智能体动作系统类型及其表现 133
7.3.1 反应式动作系统与审议式动作系统 133
7.3.2 单智能体动作系统与多智能体交互 134
7.3.3 具身智能体的动作系统：与物理及虚拟环境的互动 135
7.3.4 不同领域的动作系统特点 135

7.4 前沿进展与未来展望 137
7.4.1 智能体动作系统的可解释性与可信度 137
7.4.2 复杂智能体动作系统建模与评估的挑战 137
7.4.3 智能体动作系统的优化策略 138
7.4.4 智能体动作系统的安全机制 138
7.4.5 未来研究方向建议 139
7.5 总结 140
第8章强化学习 141
8.1 基础理论 141
8.1.1 马尔可夫决策过程 141
8.1.2 奖励机制设计 142
8.1.3 价值函数 143
8.2 从人类奖励到智能体奖励 145
8.3 强化学习中的奖励机制 146
8.3.1 奖励模型定义 146
8.3.2 外部奖励 146
8.3.3 内部奖励 147
8.3.4 混合奖励 147
8.3.5 层级奖励 148
8.4 人类反馈强化学习 148
8.4.1 RLHF框架 148
8.4.2 偏好学习 149
8.4.3 在线学习与持续优化 150
8.5 强化学习算法实现――OpenPipe ART 151
8.5.1 群体强化策略优化 151
8.5.2 群体序列策略优化 153
8.5.3 相对通用大语言模型引导奖励 155
8.5.4 ART框架的架构与实现 157
8.5.5 MCP·RL：协议级强化学习 159
8.5.6 实际应用案例 159
8.6 挑战与未来发展方向 160
8.7 总结 162
第9章评估系统 163
9.1 智能体评估的关键维度与能力 164
9.1.1 基础能力评估：规划、工具使用、自我反思与记忆 164
9.1.2 特定应用领域智能体评估 165
9.2 科学评估体系的构建 166
9.2.1 主观评估失效的典型案例 166
9.2.2 科学评估体系的构建方法论 167
9.3 智能体主流评估基准与框架 168
9.4 可信性评估 169
9.5 总结 170
第10章自进化智能体 171
10.1 自进化智能体的理论基础 172
10.1.1 认知科学视角 172
10.1.2 自进化的核心机制 175
10.2 自进化智能体的优化空间与维度 180
10.2.1 自进化的提示优化 180
10.2.2 自进化的工作流优化 182
10.2.3 自进化的工具优化 183

10.3 自进化智能体架构 184
10.3.1 组件化与模块化设计 185
10.3.2 数据驱动的自进化框架 186
10.3.3 脑启发式架构 187
10.4 科学知识发现中的自进化智能体 188
10.5 自进化智能体的技术的挑战与解决方案 190
10.5.1 现实世界交互挑战 190
10.5.2 复杂推理挑战 192
10.5.3 先验知识整合挑战 195
10.6 自进化智能体应用领域与案例研究 196
10.7 未来展望与发展趋势 197
10.8 总结 198
第11章持续运行智能体 200
11.1 持续运行智能体的价值 201
11.1.1 持续运行智能体的状态依赖性与中断代价 201
11.1.2 持续运行智能体的优势 202
11.2 持续运行智能体的定义与运行机制 203
11.2.1 持续运行智能体的核心定义与特征 204
11.2.2 后台运行与循环机制 204
11.2.3 条件触发与反馈循环 208
11.3 持续运行智能体的挑战与应对机制 213
11.3.1 持续运行智能体面临的挑战 214
11.3.2 持续运行智能体的应对机制 219
11.4 持续运行智能体LangGraph实现 223
11.4.1 LangGraph持久化机制的技术实现 224
11.4.2 错误恢复与容错机制 226
11.4.3 持续运行的方法论与最佳实践 229
11.5 持续运行智能体的评估指标 232
11.5.1 评估指标体系 232
11.5.2 基准测试与对比实验 234
11.6 总结 236
第12章自动化求职智能体 237
12.1 背景介绍 237
12.2 技术框架 238
12.3 项目准备 238
12.3.1 前置准备与环境配置 238
12.3.2 代码详解：求职自动化脚本 240
12.3.3 运行演示脚本与成果展示 251
12.4 核心概念解析 252
12.5 可扩展方向 253
12.6 总结 254

商品参数

基本信息
出版社	电子工业出版社
ISBN	9787121518355
条码	9787121518355
编者	张益新著
译者	--
出版年月	2026-01-01 00:00:00.0
开本	16开
装帧	平装
页数	254
字数	326000
版次	1
印次	1
纸张

商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]