AI应用开发Technical Deep Dive

AI Agent 模式：先把边界、状态和评估目标讲清楚，再谈 ReAct 与 Planning

发布时间2026/03/05

分类AI应用开发

预计阅读10 分钟

作者吴长龙

谈 Agent 模式最容易变成 ReAct、Reflexion、Planning 的概念列表，但真正影响工程落地的，是每种模式需要什么状态、工具边界和评估目标。

01.Agent 模式最容易被误写成“几个高级名词的合集”

很多关于 Agent 模式的文章，常见写法是列几个术语：

•ReAct
•Reflexion
•Planning
•Multi-agent

这些名字本身没有问题，但如果只停留在术语层，它们对工程落地的帮助其实很有限。真实团队更需要知道的是：

•这个模式适合哪类任务
•需要哪些状态和工具边界
•会带来什么新的复杂度
•应该用什么指标评估它值不值得上

所以 Agent 模式更适合被理解成“任务编排策略”，而不是几种看起来更聪明的思考姿势。

02.先问任务复杂度，再选模式

一个很常见的误区，是一开始就想上最复杂的 Agent 模式。更稳妥的顺序通常是：

•先看是不是普通检索问答就够了
•再看是否真的需要工具调用
•再决定要不要上计划执行
•最后才考虑多 Agent 协作

很多系统其实不需要“更强模式”，只是需要更清楚的边界和更稳定的输入。

03.一条更实用的模式谱系，通常从四层开始

1. 直接回答模式

适合：

•问答简单
•不涉及外部动作
•不需要长状态

它的优点是简单、快、成本低；缺点是上限明显。

2. 检索与工具路由模式

适合：

•需要引用知识库
•需要调用少量受限工具
•需要结构化输出

这通常是很多“AI 应用”真正的第一代稳定形态。

3. 计划执行模式

适合：

•任务需要多步完成
•中间状态需要保存
•工具调用顺序会影响结果
•允许中途暂停、重试或人工接管

这时 Planning 的价值，往往不是“显得更聪明”，而是让任务变得更可追踪。

4. 多 Agent 协作模式

适合：

•任务天然分角色
•不同子任务的上下文差异很大
•单 Agent 已经难以稳定覆盖全链路

但多 Agent 也会明显增加：

•状态同步成本
•传递性错误
•观测和评估难度

所以它应该是后手，而不是默认方案。

04.模式的关键不在“思考方式”，而在系统边界

在工程上，一个更稳的理解方式通常是：

直接回答模式需要什么

•稳定输入
•明确输出格式
•最小上下文

工具路由模式需要什么

•结构化参数
•工具权限边界
•可回放的调用日志

计划执行模式需要什么

•状态持久化
•节点级失败恢复
•中间步骤观测

多 Agent 模式需要什么

•角色边界
•共享状态约定
•冲突和接力机制

如果这些基础没准备好，模式再先进，系统也很难稳定。

05.先让任务类型结构化，再决定选哪种模式

更稳的方式，是在系统入口先给任务分类。

python snippetpython

from typing import Literal
from pydantic import BaseModel


class PatternProfile(BaseModel):
    task_type: Literal["qa", "retrieval", "tool_use", "planning", "multi_agent"]
    requires_state: bool = False
    requires_external_actions: bool = False
    needs_human_review: bool = False


def choose_pattern(profile: PatternProfile):
    if profile.task_type == "qa":
        return "direct_answer"
    if profile.task_type in {"retrieval", "tool_use"}:
        return "tool_routing"
    if profile.task_type == "planning":
        return "planner_executor"
    return "multi_agent"

这个模式的价值在于：

•模式选择可以和任务边界绑定
•团队更容易解释为什么用了某种模式
•评估也能和任务类型对齐

06.ReAct、Planning 和多 Agent 的差异，最终会落到评估方式上

很多文章喜欢讲这些模式“更强”，但更关键的问题其实是：你到底怎么知道它更好？

更合理的评估通常包括：

•直接回答模式：正确率、拒答质量、延迟
•工具路由模式：工具命中率、参数正确率、越权率
•计划执行模式：任务完成率、步数、恢复成功率
•多 Agent 模式：交接质量、重复劳动率、总体成本

如果没有和模式对应的评估指标，模式讨论就很容易停留在概念层。

07.评估不要只看“是不是更智能”，还要看系统复杂度值不值

Agent 模式的评估，更应该围绕这些问题：

•任务完成率是否真的提升
•延迟和成本是否可接受
•状态和观测复杂度是否显著上升
•运维和排障是否比原来更难
•人工接管是否变得更顺畅

这些问题比“模型看起来更会思考了”更接近真实价值。

08.三个常见误区

1. 一开始就默认上最复杂的模式

很多问题用检索、结构化输出和少量工具路由就能解决，不需要直接上计划或多 Agent。

2. 把模式术语当成架构答案

术语只是描述，真正决定系统成败的是状态、权限和评估边界。

3. 只谈能力，不谈成本和运维

模式越复杂，状态、观测和回归成本通常也越高。

09.总结

AI Agent 模式真正可交付的价值，不是多记几个名词，而是把任务复杂度、系统边界和评估目标对齐起来：

•先从最简单的模式开始
•让模式选择服从任务边界
•用状态、权限和恢复能力托住复杂模式
•用和模式匹配的指标来评估收益

只要这些原则守住，模式讨论才不会停留在概念层，而会变成真实可交付的架构判断。