
LLM
文章平均质量分 58
阿豪Jeremy
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
使用MS-SWIF框架对大模型进行SFT微调
报错:ValueError: Bfloat16 is only supported on GPUs with compute capability of at least 8.0. Your Tesla V100S-PCIE-32GB GPU has compute capability 7.0. You can use float16 instead by explicitly setting the。原创 2025-09-05 10:56:18 · 709 阅读 · 0 评论 -
从 PPO、DPO 到 GRPO:万字长文详解大模型训练中的三大关键算法
写的太好了!!原创 2025-09-04 16:06:22 · 112 阅读 · 0 评论