第三个时代:RAG时代
Tool时代让大模型拥有了行动能力。模型可以调用搜索引擎、数据库、浏览器和各种API。
但企业很快发现模型仍然不知道企业自己的知识。
例如:
- 一家银行拥有数百万份内部文档。
- 一家制造企业拥有几十年的技术手册。
- 一家互联网公司拥有庞大的产品文档和运营数据。
这些信息既不在模型训练数据中,也无法简单地封装成一个API。
于是企业开始提出一个关键问题:
1 | 如何让大模型使用训练之外的知识? |
RAG由此诞生。
什么是RAG
RAG的全称是Retrieval-Augmented Generation。中文通常翻译为”检索增强生成”。
名字虽然复杂,本质上只有一句话。先查资料,再回答问题。
传统大模型:
1 | 问题 |
RAG:
1 | 问题 |
区别看似简单,却彻底改变了企业AI的落地方式。
RAG的核心流程
一个典型RAG系统通常包含四个步骤。
第一步:文档处理
企业文档首先被切分。
例如:
1 | 员工手册 |
被拆成大量文本片段。
例如:
1 | Chunk 1 |
这些Chunk成为后续检索的基本单位。
第二步:向量化
每个Chunk被转换成向量。
例如:
1 | "报销流程" |
向量表示文本语义而不是关键词。
这意味着:
1 | 差旅报销 |
即使文字不同也可能在向量空间中非常接近。
第三步:检索
用户提出问题:
1 | 最新报销制度是什么? |
系统同样把问题转换成向量,然后寻找最相似的文档片段。
例如:
1 | Top 5 Chunks |
被召回。
第四步:生成
检索到的内容被放入上下文。
例如:
1 | 已知资料: |
然后交给大模型生成最终答案。
至此形成完整闭环。
RAG时代留下了什么
Prompt时代解决了思考问题。
Tool时代解决了行动问题。
RAG时代解决了知识问题。
它第一次让企业意识到:
1 | 大模型并不需要记住所有知识。 |
从这个角度看,RAG本质上是在为大模型构建“外部记忆”。
而这一思想后来进一步演化,成为Agent系统中长期记忆、知识检索和上下文管理的重要基础设施。