最近阅读了《智能体设计模式:智能系统构建实战指南》(Agentic Design Patterns),阅读后,对AI的核心逻辑有了一些简单的了解,为防年老记忆力衰退,特笔记如下。
- 核心内容: 系统性地梳理了构建智能体系统的 21 个核心设计模式,涵盖了从基础的提示链(Prompt Chaining)到复杂的多智能体协作(Multi-Agent Collaboration)及自主探索模式 。
- 知识体系: 书中不仅提供了技术实现路径,还将智能体系统划分为4个层次:
- Level 0:核心推理引擎。不具备工具、记忆或环境交互能力,仅依靠预训练知识进行响应。它擅长解释已知概念,但完全无法感知最新事件。类似于一名刚走出校园的实习生。他背下了所有的教科书和面试题,能解释复杂的算法概念,但因为没有公司内网权限,也不熟悉外部工具,只能根据脑子里的死知识干活。一旦业务涉及昨天的最新热搜,他便束手无策。
- Level 1:连接型问题解决者。不再局限于预训练知识,而是能执行一系列操作,从互联网或数据库等渠道收集和处理信息。实习生升级为了高级/资深程序员。他不仅有扎实的基础,还精通搜索技巧(Google/Stack Overflow)和各类三方库。他不再只靠记忆写代码,而是能通过查阅最新的技术文档和调用外部接口,创新地解决从未遇到过的新问题。
- Level 2:战略型问题解决者。这一层级的智能体具备战略规划、主动协助和自我优化能力 。它不仅能使用工具,还能通过上下文工程(Context Engineering)战略性地筛选和管理关键信息,以应对复杂的多步骤任务,并能通过反馈循环不断提升自身效率。此时的高级/资深程序员升级为架构师。他不再纠结于具体的某行代码,而是可以独立设计复杂系统的演进路径,根据业务上下文灵活调度资源,并在执行过程中预判风险(异常处理)。他能通过复盘和监控(反馈循环)不断重构和优化流程,确保长周期的复杂目标得以达成。
- Level 3:协作型多智能体系统。该层级不再追求单一的超级智能体,而是由多个专业化智能体组成的团队通过分工、互动与协作来共同实现复杂目标,类似于人类社会中不同部门的协作模式 。架构师升级为了技术总监或 CTO。他不再追求自己成为一个全能的“超级程序员”,而是转型为一名卓越的组织者。他负责构建一套协作机制,指挥前端智能体、后端智能体、测试智能体和运维智能体各司其职,通过高效的通信和分工,完成单一“孤胆英雄”绝对无法实现的巨型工程项目。
这4层是逐层递进的:
- 从 Level 0 到 Level 1:体现了“连接力”的改变(从闭门造车到拥抱互联网)。
- 从 Level 1 到 Level 2:体现了“工程力”的改变(从写一段函数到管理一个生命周期)。
- 从 Level 2 到 Level 3:体现了“组织力”的改变(从个人英雄主义到群体智能协作)。
继而提出了五大假设:

好了,闲言少叙,书归正传(呃,前文也是书中内容)。我们正式进入各个模式,每个模式都分为:模式名、模式解释、模式应用场景、模式的流程分别介绍。
1. 提示链 (Prompt Chaining)
概念解释:将复杂任务拆解为一系列顺序执行的线性子任务,每一步的输出作为下一步的输入。
应用场景:内容创作流水线(撰写->翻译->校对)、多步推理、结构化数据提取。
流程示意:输入->子任务 A 处理->中间结果->子任务 B 处理->最终输出。
重点注意:跨步骤的上下文漂移;前一步骤对后一步骤的格式化影响。
2. 路由 (Routing)
概念解释:根据用户输入或环境状态,通过条件逻辑将控制流导向不同的专用函数、工具或子流程。
应用场景:客户咨询分类处理(退货/投诉/技术支持)、根据难度分配模型(大模型处理复杂问题,小模型处理简单问题)。
流程示意:输入->路由分类器->分支 A/B/C(任选一)专用 Agent/工具执行->输出。
重点注意:分类器的准确性直接决定后续路径;需设置兜底机制(Fallback)。
3. 并行化 (Parallelization)
概念解释:将任务拆分为多个独立的子任务并同时执行,最后合并结果。
应用场景:多源并发搜索、不同模型方案投票取优、大型文档的分块并行处理。
流程示意:输入->任务拆分->并行执行(Task 1, 2...n)->结果聚合->最终结果。
重点注意:合并阶段的逻辑冲突处理;执行成本与效率的权衡。
4. 反思 (Reflection)
概念解释:智能体对自己的初步输出进行自我审查、纠错和完善的循环过程。
应用场景:代码生成(自测纠错)、事实核查、高要求的内容润色。
流程示意:生成初稿->审查/批判->判断是否通过?--(通过继续/否则返回重写)--> 最终输出。
重点注意:避免“幻觉循环”(模型重复坚持错误);设置最大迭代次数以防陷入死循环。
5. 工具使用 (Tool Use / 函数调用)
概念解释:使模型能识别何时需要外部能力,并生成调用外部 API、数据库或代码环境的结构化指令。
应用场景:实时天气查询、操作计算器、读写私有数据库。
流程示意:输入-> 模型决定用工具->生成 JSON 参数->环境执行工具->结果反馈模型->总结回复。
重点注意:工具描述(docstring)的清晰度;处理工具调用失败的鲁棒性。
6. 规划 (Planning)
概念解释:针对无固定路径的开放式复杂目标,先制定战略计划再分步实施,并在执行中动态调整。
应用场景:组织复杂活动(如旅行策划)、深度科研调研。
流程示意:目标设定->规划器分解步骤->逐步执行->根据执行反馈更新计划->完成。
重点注意:应对动态环境变化的灵活性;防止计划在执行中偏离核心目标。
7. 多智能体协作 (Multi-Agent Collaboration)
概念解释:多个具有不同角色的专业智能体,通过特定通信结构分工协作,共同完成复杂系统目标。
应用场景:软件开发团队模拟(产品经理+程序员+测试员)、科学研究工作流。
流程示意:目标输入->协调者分配角色-> 角色间交互/消息传递-> 协作产出->交付。
重点注意:角色定义的互补性;管理智能体间通信的信噪比和 Token 开销。
看了这个模式,我就改了现在我编码用的Agent,让他们变成了一个团队,不过不太好用。
8. 记忆管理 (Memory Management)
概念解释:在不同时间维度(会话、临时状态、长期知识)上管理和检索智能体所需的信息。
应用场景:个性化助手(记住用户偏好)、长对话一致性维护。
流程示意:交互发生->信息提取/存储->根据上下文触发检索->记忆注入提示词->生成。
重点注意:区分短期上下文(Session)与长期事实(Memory);用户隐私数据保护。
感觉,在这记忆管理上,Gemini、ChatGPT远比国内的做得要好很多。
9. 学习与适应 (Learning and Adaptation)
概念解释:通过历史经验、反馈闭环或微调,使智能体随时间自主改进其策略和表现。
应用场景:自动进化的编码智能体(SICA)、基于人类反馈持续优化的助手。
流程示意:任务执行->获取反馈(奖励/惩罚)->策略更新 ->下次任务改进。
重点注意:建立有效的评估反馈回路;防止由于负向反馈导致的性能漂移。
无监督学习的典范。
10. 模型上下文协议 (MCP)
概念解释:标准化智能体与外部资源(文件系统、数据库、本地工具)连接的开放标准。
应用场景:跨平台的工具集共享、企业私有数据源的安全接入。
流程示意:智能体客户端->MCP 协议->MCP 服务器(连接各种资源)->资源回传。
重点注意:跨厂商的互操作性;服务器端的权限安全管控。
好吧,最近在Manus的股价,让人心潮澎湃。
11. 目标设定与监控 (Goal Setting and Monitoring)
概念解释:为智能体设定明确的质量检查表,并在其执行过程中实时监控行为是否符合目标约束。
应用场景:对输出有严格业务合规要求的场景(如金融分析、代码审计)。
流程示意:输入+质量清单->执行->监控器对比(Checkpoint)->偏差修复->结果。
重点注意:目标衡量的可量化性;模型作为监视器时发现自身偏离目标的局限性。
12. 异常处理与恢复 (Error Handling and Recovery)
概念解释:在智能体遇到执行错误(如 API 超时、幻觉)时,采取自动化的补救和恢复策略。
应用场景:不稳定的外部服务调用、生产环境下的全天候自动运行智能体。
流程示意:执行动作->检测到错误->触发逻辑(重试/退避/ fallback)->恢复正常执行。
重点注意:优雅降级机制;避免无限重试导致的资源浪费。
13. 人类参与环节 (Human-in-the-Loop)
概念解释:在智能体决策链的关键节点引入人工干预(审核、修正或选择),实现人机协同。
应用场景:敏感内容发布、大额金融交易授权。
流程示意:智能体建议->人工审查/反馈->智能体执行人类修正后的方案。
重点注意:明确人机切换触发点;最小化对人类的干扰频率以保持效率。
14. 知识检索 (RAG)
概念解释:通过向量检索、语义匹配等手段,为模型注入实时、私有的外部背景知识,减少幻觉。
应用场景:企业私有文档问答、基于最新资讯的摘要生成。
流程示意:用户查询->检索知识库 ->提取相关块->组合提示词->生成。
重点注意:切片(Chunking)策略的合理性;检索召回率与生成准确率的平衡。
前几年基本是RAG的天下,现在大家不提了,感觉主要是1. 自己搞半天的RAG,还不如基座模型一次更新;2. 高质量的原始数据的确烧人啊。
15. 智能体间通信 (A2A)
概念解释:不同框架或服务中的智能体,通过标准协议交换任务、状态和结果。
应用场景:分布式多智能体系统、跨组织智能体协作。
流程示意:Agent A (HTTP Request) ->A2A 协议->Agent B (Process) 结果回传 A。
重点注意:统一数字身份(AgentCard);处理通信过程中的身份认证与安全。
16. 资源感知优化 (Resource-Aware Optimization)
概念解释:动态调整模型使用策略,在成本、延迟和输出质量之间进行战术平衡。
应用场景:处理海量请求的成本优化应用、低延迟边缘设备部署。
流程示意:请求进入->复杂度评估->动态分流(大/小模型/剪枝)->低成本高效率输出。
重点注意:上下文剪枝策略;确保降本不导致严重质量下滑。
17. 推理技术 (Reasoning Techniques)
概念解释:激活模型的显式思维过程(如 CoT 思维链、ToT 思维树),提升逻辑准确性。
应用场景:数学解题、法律条文分析、复杂代码逻辑优化。
流程示意:输入问题 ->模型分解推理逻辑 -> 中间推理步骤展示 -> 最终结论。
重点注意:推理过程的可解释性;避免推理过程中的逻辑跳跃或幻觉。
18. 护栏与安全模式 (Guardrails and Safety)
概念解释:在智能体系统的输入和输出端设置合规、安全和逻辑校验层。
应用场景:防止 SQL 注入、过滤有害言论、防止敏感隐私泄露。
流程示意:用户输入-> 安全过滤-> 模型处理 -> 结果校验 -> 交付。
重点注意:隔离执行环境(沙箱);双向清洗输入输出内容。
19. 评估与监控 (Evaluation and Monitoring)
概念解释:超越简单的对错,对智能体的决策轨迹、工具效率和执行成本进行全方位的定性定量分析。
应用场景:智能体上线前的基准测试、生产环境的持续性能追踪。
流程示意:执行记录 ->指标打分->(Evalset) -> 轨迹分析 -> 报告与优化。
重点注意:轨迹评估优于最终输出评估;需开发针对协作指标的专用评估集。
20. 优先级排序 (Prioritization)
概念解释:在处理多并发任务或信息流时,智能体根据预设规则、用户意图及紧急程度动态排序。
应用场景:自动化客服工单分配、个人生活助手的时间表排期。
流程示意:多任务进入 ->优先级分类(P0/P1...)-> 资源分配执行 -> 状态更新。
重点注意:意图到紧急程度的映射逻辑;处理资源竞争时的抢占策略。
21. 探索与发现 (Exploration and Discovery)
概念解释:通过多智能体模拟科学方法,主动在未知领域寻找信息、生成假设并设计实验。
应用场景:科学研究(AI Scientist)、市场新机遇挖掘、创意内容探索。
流程示意:目标领域-> 角色团队协作(假设、评审、实验)-> 发现新知识-> 总结报告。
重点注意:发现“未知的未知”而非优化已知;保持人类对研究方向的战略控制。
出家人不打诳语,后边几个模型的确有点烧脑,代码我也看着迷糊,不过,如果仅把该书当做了解AI程序员们的发量,其实了解这些基础概念已然足够。
--2026,大家一起加油吧。