第四个时代:Agent时代
Prompt时代让大模型学会了思考。
Tool时代让大模型拥有了行动能力。
RAG时代让大模型能够获取外部知识。
但当这些能力组合在一起后,人们很快发现:
一个新的问题出现了。
1 | 大模型能够回答问题,却无法真正完成任务。 |
RAG时代为什么不够
假设用户提出一个问题:
1 | 苹果公司的AI战略是什么? |
RAG非常擅长处理这类任务。
它可以:
- 检索资料
- 阅读文档
- 组织答案
最终给出一份不错的总结。
但现实世界中的需求往往不是这样。
用户真正想说的是:
1 | 帮我研究苹果AI战略, |
这已经不是一个问题。
而是一个任务。
为了完成它,系统可能需要:
1 | 搜索财报 |
这里不存在一次检索就能得到答案的情况。
系统必须不断行动、不断获取信息、不断修正自己的判断。
RAG开始暴露出边界。
Agent是什么
Agent通常被翻译为“智能体”。
但从本质上说:
1 | Agent并不是一种模型,而是一种工作方式。 |
传统方式:
1 | 问题 |
Agent方式:
1 | 目标 |
最大的区别在于:
- 用户不再告诉系统具体步骤。
- 只需要告诉系统目标。
Agent时代的关键突破
Planning(规划)
Agent开始学会拆解任务。
规划能力让复杂任务变得可执行。
Multi-Step Execution(多步执行)
传统RAG通常只执行一次检索。
Agent则能够连续行动。
例如:
1 | 搜索 |
形成完整闭环。
Reflection(反思)
Agent开始具备简单的自我评估能力。
例如:
1 | 资料是否足够? |
这种能力让系统逐渐摆脱“一次回答定终身”的模式。
Tool Orchestration(工具编排)
在Tool时代。
模型通常一次调用一个工具。
Agent时代则开始组合使用多个工具。
例如:
1 | 浏览器 |
多个工具协同完成同一个目标。
Agent时代留下了什么
Prompt时代让模型拥有了思考能力。
Tool时代让模型拥有了行动能力。
RAG时代让模型拥有了知识获取能力。
Agent时代则第一次让模型拥有了任务执行能力。
从这一阶段开始,大模型不再只是问答系统,而开始成为真正的软件执行主体。