AI Agent 阿航的博客

发表评论
153 次浏览

A+

所属分类：笔记

1 Agent 定义

Agent = LLM + Tools（例如读写文件内容、查看文件列表、运行终端命令等（API函数））。

Agent 有很多种类，如编程 Agent（例如 Cursor），PPT Agent，深度搜索 Agent 等等。

2 Agent 运行模式

ReAct 和 Plan-and-Execute 是当前大模型智能体（LLM-based Agent）最主流的两种运行范式（Operating Paradigms），它们定义了智能体在执行复杂任务时的思考方式、工具调用方式和决策结构。

2.1 ReAct 模式（Reason + Act）

ReAct 模式由 Google Research 在论文 “ReAct: Synergizing Reasoning and Acting in Language Models” （ICLR 2023）中提出。核心思想是：让语言模型在推理（Reasoning）与行动（Acting）之间交替进行，通过与环境的反馈循环来动态调整策略。换句话说，它不是一次性生成完整计划，而是边思考边行动、边观察边修正。

1. 工作机制：Thought（思考） -> Action（行动） -> Observation（观察）-> Thought -> Action -> ... -> Final Answer（回答）。

阶段	内容
Thought（思考）	模型基于当前上下文和目标进行逻辑推理，决定下一步要做什么。
Action（行动）	根据推理结果执行动作，如调用工具、检索信息、执行代码等。
Observation（观察）	环境返回反馈结果（例如查询到的信息、函数输出等）。
循环执行	模型根据 Observation 更新思考，再决定下一步行动。
Final Answer（回答）	模型输出最终答案

2. 运行流程：

示例：

Prompt：“请查找世界上最高的山峰的高度”；

Thought: 我需要找出世界上最高的山峰。
Action: 查询 ‘世界上最高的山峰’。
Observation: 世界上最高的山峰是珠穆朗玛峰。
Thought: 我现在需要查询珠穆朗玛峰的高度。
Action: 查询 ‘珠穆朗玛峰高度’。
Observation: 珠穆朗玛峰高8848.86米。
Final Answer: 珠穆朗玛峰高8848.86米。

2.2 Plan-and-Execute 模式

Plan-and-Execute 模式的基本理念是：先规划（Plan）整个任务的步骤【规划阶段】，再逐步执行（Execute）这些步骤【执行阶段】。是一种分层的 “任务分解式” 思维方式，强调全局规划与分步执行。

1. Plan-And-Execute Agent 组成：

Plan 模型（列举执行计划）；
Re-Plan 模型（根据每一步的执行结果动态修改执行计划）；
执行 Agent（用于执行每一个步骤）；
主程序（负责串联整个流程）；

其中，Plan 和 Re-Plan 模型可以是同一个模型也可以是两个不同的模型。

2. 运行流程：

3. 示例

（1）Planning 阶段，模型生成高层次的任务计划

Prompt：帮我撰写一份学术报告
计划：
Step 1. 搜集相关论文。
Step 2. 提取关键观点。
Step 3. 撰写摘要。
Step 4. 输出最终报告。

（2）Execution 阶段

Agent 根据计划逐步执行：

执行 Step 1 -> 获取数据 -> 根据反馈更新计划（Replan）-> 执行 Step 2 -> ... -> 直至完成全部步骤。

每个子任务可单独完成，也可并行执行，可结合多个子 Agent 协作执行任务。

3 参考

Agent 的概念、原理与构建模式 —— 从零打造一个简化版的 Claude Code

1 Agent 定义

2 Agent 运行模式

2.1 ReAct 模式（Reason + Act）

2.2 Plan-and-Execute 模式

3 参考

发表评论取消回复

登录 找回密码

登录找回密码