第三个时代：RAG时代

发表于 2025-06-12 更新于 2026-06-03

RAG解决的问题是如何让大模型使用训练数据之外的知识。

Tool时代让大模型拥有了行动能力。模型可以调用搜索引擎、数据库、浏览器和各种API。
但企业很快发现模型仍然不知道企业自己的知识。

例如：

这些信息既不在模型训练数据中，也无法简单地封装成一个API。
于是企业开始提出一个关键问题：

1	如何让大模型使用训练之外的知识？

RAG由此诞生。

什么是RAG

RAG的全称是Retrieval-Augmented Generation。中文通常翻译为”检索增强生成”。
名字虽然复杂，本质上只有一句话。先查资料，再回答问题。

传统大模型：

问题 
 ↓ 
LLM 
 ↓ 
答案

RAG：

问题
 ↓
检索
 ↓
相关知识
 ↓
LLM
 ↓
答案

区别看似简单，却彻底改变了企业AI的落地方式。

一个典型RAG系统通常包含四个步骤。

企业文档首先被切分。

例如：

员工手册
产品文档
技术规范
会议记录
FAQ

被拆成大量文本片段。

例如：

Chunk 1
Chunk 2
Chunk 3
...

这些Chunk成为后续检索的基本单位。

每个Chunk被转换成向量。

例如：

"报销流程"

↓

[0.13, 0.82, ...]

向量表示文本语义而不是关键词。
这意味着：

1 2	差旅报销商务出差费用申请

即使文字不同也可能在向量空间中非常接近。

用户提出问题：

1	最新报销制度是什么？

系统同样把问题转换成向量，然后寻找最相似的文档片段。

例如：

1	Top 5 Chunks

被召回。

检索到的内容被放入上下文。

例如：

已知资料：

[Chunk1]
[Chunk2]
[Chunk3]

请根据资料回答问题。

然后交给大模型生成最终答案。
至此形成完整闭环。

Prompt时代解决了思考问题。
Tool时代解决了行动问题。
RAG时代解决了知识问题。
它第一次让企业意识到：

1 2	大模型并不需要记住所有知识。更重要的是能够在需要时找到知识。

从这个角度看，RAG本质上是在为大模型构建“外部记忆”。
而这一思想后来进一步演化，成为Agent系统中长期记忆、知识检索和上下文管理的重要基础设施。