第二个时代:tool时代

Prompt时代证明了一件事:大模型很聪明。
它能写代码、写文章、解释概念、回答问题。

但很快,人们发现了一个致命问题:

1
大模型只能思考,却无法行动。

它知道如何订机票,但不能帮你订机票。
它知道如何查天气,但不能真的查询天气。
它知道如何发邮件,但不能真正发送邮件。

从本质上说,当时的大模型就像一个被关在房间里的天才。
它拥有知识,却无法接触现实世界。

Tool时代解决了什么问题

行业开始思考一个问题:如果让大模型能够调用外部工具,会发生什么?
用户询问上海天气,传统Prompt模式下模型只能猜测。
但如果允许模型调用天气API——

1
WeatherAPI(city="Shanghai")

那么模型就能获得真实世界数据。
于是行业开始尝试把各种能力封装成工具:

  • 搜索引擎
  • 数据库
  • 浏览器
  • 文件系统
  • 邮件系统
  • 支付接口
  • 企业内部API

然后让大模型决定何时调用。
Tool Use(工具调用)由此诞生。

Tool时代的核心思想

在传统软件中:

1
2
3
4
5
人类

代码

工具

开发者明确指定:

  • 哪个函数执行。
  • 哪个接口调用。
  • 哪个数据库查询。

而在Tool时代:

1
2
3
4
5
人类

LLM

工具

模型开始负责决策。
开发者只负责提供能力。

Function Calling的出现

早期Tool系统其实非常脆弱。
开发者通常让模型输出固定格式,然后再用程序解析。

1
2
3
4
{
"tool": "weather",
"city": "Shanghai"
}

这种方式容易出错。
2023年,OpenAI推出Function Calling。
模型不再生成普通文本,而是生成结构化调用请求。

例如:

1
2
3
4
5
6
{
"function": "get_weather",
"arguments": {
"city": "Shanghai"
}
}

这意味着模型第一次拥有了标准化调用工具的能力。
Function Calling后来成为几乎所有Agent框架的基础设施。

Tool时代留下了什么

Prompt时代让模型拥有了思考能力。
Tool时代让模型拥有了行动能力。
这是AI应用发展中的第一次重大跃迁。
从这一阶段开始,大模型不再只是聊天机器人,而开始成为软件系统中的决策核心。
如果说Prompt时代的大模型是一颗大脑。
那么Tool时代的大模型第一次长出了手和脚。