第三个时代:RAG时代

Tool时代让大模型拥有了行动能力。模型可以调用搜索引擎、数据库、浏览器和各种API。
但企业很快发现模型仍然不知道企业自己的知识。

例如:

  • 一家银行拥有数百万份内部文档。
  • 一家制造企业拥有几十年的技术手册。
  • 一家互联网公司拥有庞大的产品文档和运营数据。

这些信息既不在模型训练数据中,也无法简单地封装成一个API。
于是企业开始提出一个关键问题:

1
如何让大模型使用训练之外的知识?

RAG由此诞生。

什么是RAG

RAG的全称是Retrieval-Augmented Generation。中文通常翻译为”检索增强生成”。
名字虽然复杂,本质上只有一句话。先查资料,再回答问题。

传统大模型:

1
2
3
4
5
问题 

LLM

答案

RAG:

1
2
3
4
5
6
7
8
9
问题

检索

相关知识

LLM

答案

区别看似简单,却彻底改变了企业AI的落地方式。

RAG的核心流程

一个典型RAG系统通常包含四个步骤。

第一步:文档处理

企业文档首先被切分。

例如:

1
2
3
4
5
员工手册
产品文档
技术规范
会议记录
FAQ

被拆成大量文本片段。

例如:

1
2
3
4
Chunk 1
Chunk 2
Chunk 3
...

这些Chunk成为后续检索的基本单位。

第二步:向量化

每个Chunk被转换成向量。

例如:

1
2
3
4
5
"报销流程"



[0.13, 0.82, ...]

向量表示文本语义而不是关键词。
这意味着:

1
2
差旅报销
商务出差费用申请

即使文字不同也可能在向量空间中非常接近。

第三步:检索

用户提出问题:

1
最新报销制度是什么?

系统同样把问题转换成向量,然后寻找最相似的文档片段。

例如:

1
Top 5 Chunks

被召回。

第四步:生成

检索到的内容被放入上下文。

例如:

1
2
3
4
5
6
7
已知资料:

[Chunk1]
[Chunk2]
[Chunk3]

请根据资料回答问题。

然后交给大模型生成最终答案。
至此形成完整闭环。

RAG时代留下了什么

Prompt时代解决了思考问题。
Tool时代解决了行动问题。
RAG时代解决了知识问题。
它第一次让企业意识到:

1
2
大模型并不需要记住所有知识。
更重要的是能够在需要时找到知识。

从这个角度看,RAG本质上是在为大模型构建“外部记忆”。
而这一思想后来进一步演化,成为Agent系统中长期记忆、知识检索和上下文管理的重要基础设施。