AI Agent

  • A+
所属分类:笔记

1 Agent 定义

Agent = LLM + Tools(例如读写文件内容、查看文件列表、运行终端命令等(API函数))。

Agent 有很多种类,如编程 Agent(例如 Cursor),PPT Agent,深度搜索 Agent 等等。

2 Agent 运行模式

ReAct 和 Plan-and-Execute 是当前大模型智能体(LLM-based Agent)最主流的两种运行范式(Operating Paradigms),它们定义了智能体在执行复杂任务时的思考方式、工具调用方式和决策结构。

2.1 ReAct 模式(Reason + Act)

ReAct 模式由 Google Research 在论文 “ReAct: Synergizing Reasoning and Acting in Language Models” (ICLR 2023)中提出。核心思想是:让语言模型在推理(Reasoning)与行动(Acting)之间交替进行,通过与环境的反馈循环来动态调整策略。换句话说,它不是一次性生成完整计划,而是边思考边行动、边观察边修正。

1. 工作机制:Thought(思考) -> Action(行动) -> Observation(观察)-> Thought -> Action -> ... -> Final Answer(回答)

阶段内容
Thought(思考)模型基于当前上下文和目标进行逻辑推理,决定下一步要做什么。
Action(行动)根据推理结果执行动作,如调用工具、检索信息、执行代码等。
Observation(观察)环境返回反馈结果(例如查询到的信息、函数输出等)。
循环执行模型根据 Observation 更新思考,再决定下一步行动。
Final Answer(回答)模型输出最终答案
AI Agent

2. 运行流程:

示例:

Prompt:“请查找世界上最高的山峰的高度”;

Thought: 我需要找出世界上最高的山峰。
Action: 查询 ‘世界上最高的山峰’。
Observation: 世界上最高的山峰是珠穆朗玛峰。

Thought: 我现在需要查询珠穆朗玛峰的高度。
Action: 查询 ‘珠穆朗玛峰 高度’。
Observation: 珠穆朗玛峰高8848.86米

Final Answer: 珠穆朗玛峰高8848.86米。

AI Agent

2.2 Plan-and-Execute 模式

Plan-and-Execute 模式的基本理念是:先规划(Plan)整个任务的步骤【规划阶段】,再逐步执行(Execute)这些步骤【执行阶段】。是一种分层的 “任务分解式” 思维方式,强调全局规划分步执行

1. Plan-And-Execute Agent 组成:

  1. Plan 模型(列举执行计划);
  2. Re-Plan 模型(根据每一步的执行结果动态修改执行计划);
  3. 执行 Agent(用于执行每一个步骤);
  4. 主程序(负责串联整个流程);

其中,Plan 和 Re-Plan 模型可以是同一个模型也可以是两个不同的模型。

2. 运行流程:

AI Agent

3. 示例

(1)Planning 阶段,模型生成高层次的任务计划

Prompt:帮我撰写一份学术报告
计划:
Step 1. 搜集相关论文。
Step 2. 提取关键观点。
Step 3. 撰写摘要。
Step 4. 输出最终报告。

(2)Execution 阶段

Agent 根据计划逐步执行:

执行 Step 1 -> 获取数据 -> 根据反馈更新计划(Replan)-> 执行 Step 2 -> ... -> 直至完成全部步骤。

每个子任务可单独完成,也可并行执行,可结合多个子 Agent 协作执行任务。

3 参考

Agent 的概念、原理与构建模式 —— 从零打造一个简化版的 Claude Code

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: