ByteCat

0%

利用大模型实现文本匹配

发表于 2023-03-13 更新于 2023-12-21

利用本地大模型实现伪zero-shot中文文本语义匹配。

利用大模型实现信息抽取

发表于 2023-03-13 更新于 2023-12-21

利用本地大模型实现伪zero-shot中文文本信息抽取。

利用大模型实现文本分类

发表于 2023-03-13 更新于 2023-12-21

利用本地大模型实现伪zero-shot中文文本分类。

大模型服务部署架构设计

发表于 2023-03-12 更新于 2024-11-18

介绍下大模型应用后端服务常见的几种部署架构。

在云服务器上的部署实践（3）

发表于 2023-03-12 更新于 2024-05-10

利用Ollama在云服务器上构建大模型后端api服务。

在云服务器上的部署实践（2）

发表于 2023-03-12 更新于 2024-03-09

利用LocalAI在云服务器上构建大模型后端api服务。

在云服务器上的部署实践（1）

发表于 2023-03-12 更新于 2024-09-12

在无CPU的阿里云服务器部署chatglm3-6b大模型。

大模型量化格式：litertlm

发表于 2023-03-12 更新于 2026-05-02

google的端上推理格式，litertlm。

加载GGUF模型的便捷方式

发表于 2023-03-12 更新于 2026-05-02

LM-Studio，在本地私密运行AI模型。

界面化的量化工具autoGGUF

发表于 2023-03-12 更新于 2024-09-12

AutoGGUF提供了一个图形用户界面，用于使用llama.cpp库量化GGUF模型。