- A+
1 Agent 定义
Agent = LLM + Tools(例如读写文件内容、查看文件列表、运行终端命令等(API函数))。
Agent 有很多种类,如编程 Agent(例如 Cursor),PPT Agent,深度搜索 Agent 等等。
2 Agent 运行模式
ReAct 和 Plan-and-Execute 是当前大模型智能体(LLM-based Agent)最主流的两种运行范式(Operating Paradigms),它们定义了智能体在执行复杂任务时的思考方式、工具调用方式和决策结构。
2.1 ReAct 模式(Reason + Act)
ReAct 模式由 Google Research 在论文 “ReAct: Synergizing Reasoning and Acting in Language Models” (ICLR 2023)中提出。核心思想是:让语言模型在推理(Reasoning)与行动(Acting)之间交替进行,通过与环境的反馈循环来动态调整策略。换句话说,它不是一次性生成完整计划,而是边思考边行动、边观察边修正。
1. 工作机制:Thought(思考) -> Action(行动) -> Observation(观察)-> Thought -> Action -> ... -> Final Answer(回答)。
阶段 | 内容 |
Thought(思考) | 模型基于当前上下文和目标进行逻辑推理,决定下一步要做什么。 |
Action(行动) | 根据推理结果执行动作,如调用工具、检索信息、执行代码等。 |
Observation(观察) | 环境返回反馈结果(例如查询到的信息、函数输出等)。 |
循环执行 | 模型根据 Observation 更新思考,再决定下一步行动。 |
Final Answer(回答) | 模型输出最终答案 |

2. 运行流程:
示例:
Prompt:“请查找世界上最高的山峰的高度”;
Thought: 我需要找出世界上最高的山峰。
Action: 查询 ‘世界上最高的山峰’。
Observation: 世界上最高的山峰是珠穆朗玛峰。
Thought: 我现在需要查询珠穆朗玛峰的高度。
Action: 查询 ‘珠穆朗玛峰 高度’。
Observation: 珠穆朗玛峰高8848.86米。
Final Answer: 珠穆朗玛峰高8848.86米。

2.2 Plan-and-Execute 模式
Plan-and-Execute 模式的基本理念是:先规划(Plan)整个任务的步骤【规划阶段】,再逐步执行(Execute)这些步骤【执行阶段】。是一种分层的 “任务分解式” 思维方式,强调全局规划与分步执行。
1. Plan-And-Execute Agent 组成:
- Plan 模型(列举执行计划);
- Re-Plan 模型(根据每一步的执行结果动态修改执行计划);
- 执行 Agent(用于执行每一个步骤);
- 主程序(负责串联整个流程);
其中,Plan 和 Re-Plan 模型可以是同一个模型也可以是两个不同的模型。
2. 运行流程:

3. 示例
(1)Planning 阶段,模型生成高层次的任务计划
Prompt:帮我撰写一份学术报告
计划:
Step 1. 搜集相关论文。
Step 2. 提取关键观点。
Step 3. 撰写摘要。
Step 4. 输出最终报告。(2)Execution 阶段
Agent 根据计划逐步执行:
执行 Step 1 -> 获取数据 -> 根据反馈更新计划(Replan)-> 执行 Step 2 -> ... -> 直至完成全部步骤。
每个子任务可单独完成,也可并行执行,可结合多个子 Agent 协作执行任务。
3 参考