探索数据的世界
使用gradio实现大模型单卡推理的网页版部署。
同时多人对话时候保持各自对话历史。
大模型多显卡推理方案。
能在单个显卡上部署的支持中文的开源LLM推荐。
深入浅出讲解什么是GRPO。
深入浅出讲解什么是DPO。
深入浅出讲解什么是RLHF。
从头预训练一只超迷你LLaMA3。
评估部分,只需要看模型整体的知识掌握程度即可。
训练部分,自研pretrain模型如何训练。