ByteCat

0%

大模型后训练之GRPO

发表于 2023-03-11 更新于 2025-08-15

深入浅出讲解什么是GRPO。

大模型后训练之DPO

发表于 2023-03-11 更新于 2025-08-15

深入浅出讲解什么是DPO。

大模型后训练之RLHF

发表于 2023-03-11 更新于 2025-08-15

深入浅出讲解什么是RLHF。

训练一个迷你llama3模型

发表于 2023-03-11 更新于 2025-08-22

从头预训练一只超迷你LLaMA3。

如何从0到1进行预训练工作-理论篇（4）

发表于 2023-03-11 更新于 2025-07-14

评估部分，只需要看模型整体的知识掌握程度即可。

如何从0到1进行预训练工作-理论篇（3）

发表于 2023-03-11 更新于 2025-07-14

训练部分，自研pretrain模型如何训练。

如何从0到1进行预训练工作-理论篇（2）

发表于 2023-03-11 更新于 2025-07-14

数据部分，自研pretrain模型如何准备数据集。

如何从0到1进行预训练工作-理论篇（1）

发表于 2023-03-11 更新于 2025-07-14

背景部分，自研pretrain模型的意义有哪些。

算一算大模型显存占用

发表于 2023-03-10 更新于 2023-11-08

大模型在部署的时候，肯定离不开一个概念，叫显存占用。这里主要来看怎么计算大模型的显存占用。

从模型仓库下载大模型

发表于 2023-03-10 更新于 2024-11-01

从huggingface模型仓库下载大模型文件和代码。