大模型微调

最新推荐文章于 2025-03-20 12:48:10 发布

原创

最新推荐文章于 2025-03-20 12:48:10 发布 · 900 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #深度学习 #神经网络 #知识图谱 #个人开发

以下是在本地部署使用LLaMA-Factory导出的LoRA模型，并通过Ollama运行的步骤指南：

1. 准备工作

已训练好的LoRA模型: 确保通过LLaMA-Factory导出了LoRA适配器文件（通常是 adapter_model.bin 和 adapter_config.json）。
基础模型: 准备LoRA适配器对应的基座模型（如LLaMA-2、Mistral等），需转换为Ollama支持的格式（如GGUF）。
Ollama环境: 确保已安装Ollama（官网下载）。

2. 将模型转换为GGUF格式

如果基础模型尚未是GGUF格式，需使用 llama.cpp 工具转换：

步骤

克隆 llama.cpp 仓库并安装依赖：

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
make

转换PyTorch模型到GGUF：

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

猴的哥儿

关注关注

34
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

欺诈文本分类检测（十二）：模型导出与部署

golfxiao的专栏

09-06

1400

使用LoRA 适配器训练完后，每次推理时候都需要分别加载基座模型和 LoRA 适配器，一方面比较繁琐，另一方面也不利于模型部署，因此有必要将基座模型和 LoRA 适配器进行合并，导出成一个模型。

详解大模型微调数据集构建方法(持续更新)

热门推荐

herosunly的博客

06-05

27万+

本文详细介绍了大模型微调数据集构建方法，希望能对学习大模型的同学们有所帮助。文章目录 1. 前言 2. 微调数据集构建方法 2.1 方法一 2.2 方法二 2.3 方法三 2.4 方法四

参与评论您还未登录，请先登录后发表或查看评论

LLaMA-Factory微调llama3之模型的合并，并采用llama.cpp量化成ollama支持的gguf格式模型，生成api使用

猪神-PIGGOD

08-08

7833

上期我们已经成功的训练了模型，让llama3中文聊天版知道了自己的名字这次我们从合并模型开始，然后使用llama.cpp量化成gguf格式，并且调用api。

ollama 使用自己的微调模型

spiderwower的博客

05-12

4万+

微调大模型的方法，这里不展开说，我使用的lora微调方法。微调大模型需要比较高的显存，推荐在云服务器上进行训练，系统环境为linux。

【LLaMA-Factory使用教程】大模型本地部署和微调

啥都想干&&啥都干不好的博客

01-23

530

大模型部署微调教程

大模型指令微调概述，大模型微调简单介绍ppt

10-30

大模型微调，也称为指令微调（Instruction Tuning），是针对大型语言模型进行的一种优化方法。这种技术旨在缩小模型在预训练期间的无监督目标（如预测下一个单词）与用户期望的指令执行任务之间的差距。通过在特定的...

大模型微调数据集-可用于大模型微调的医疗数据集-附README预料数据使用方式说明.zip

10-16

在当前人工智能技术迅速发展的背景下，大模型微调已成为机器学习领域中提高模型性能的重要手段。特别是对于医疗领域，通过微调大型语言模型，可以使其更好地理解和处理与健康相关的信息，从而在临床决策支持、疾病...

大模型微调选择模型的实战技巧(持续更新)

herosunly的博客

07-11

20万+

本文主要介绍了大模型微调选择模型的实战技巧(持续更新)，希望对学习大语言模型的同学们有所帮助。文章目录 1. 前言 2. 实战技巧

大模型微调出错的解决方案（持续更新）

herosunly的博客

06-13

20万+

本文主要介绍了大模型微调出错的解决方案（持续更新），希望对学习大语言模型的同学们有所帮助。文章目录 1. 前言 2. 解决方案 2.1 大模型环境配置问题 2.2 实时观测GPU变化 2.3 微调卡住不动

小白也能微调大模型：LLaMA-Factory使用心得

MeetLight

03-30

1万+

本文介绍了初学者如何使用LLaMA-Factory进行大模型的微调，包含训练、测试数据集的构建，训练任务相关的参数，训练完成后的测试集上推理等环节

LlamaFactory：解锁LLM微调效率的终极神器！

Code1994的博客

12-25

1579

LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。通过 LLaMA Factory，可以在无需编写任何代码的前提下，在本地完成上百种预训练模型的微调，框架特性包括：模型种类：LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等等。

通过LlaMA-Factory导出的模型部署到Ollama

qq_35175478的博客

01-09

1168

仓库地址：https://github.com/ggerganov/llama.cpp。LlaMA-Factory导出的模型转换格式。创建ModelFile文件。

使用LLaMA Factory微调导出模型，并用ollama运行，用open webui使用该模型

最新发布

FlyLikeButterfly的博客

03-20

2962

使用llama factory微调模型，导出模型，使用ollama加载运行模型，使用open webui页面调用模型；

自定义数据集使用llama_factory微调模型并导入ollama

weixin_53162188的博客

04-14

1万+

本文所有操作均在linux系统下完成。

一些Llama3微调工具以及如何在Ollama中运行

xiangxueerfei的博客

05-30

2952

Llama3是Meta提供的一个开源大模型，包含8B和 70B两种参数规模，涵盖预训练和指令调优的变体。这个开源模型推出已经有一段时间，并且在许多标准测试中展示了其卓越的性能。特别是Llama3 8B，其具备小尺寸和高质量的输出使其成为边缘设备或者移动设备上实现LLM的完美选择。但是Llama3也还有许多缺陷，因此，在场景应用中，有时候还需要对其进行微调，以提升中文能力、场景应用的专业度等。目前有许多团队在做微调工具，他们的贡献提高了我们的效率、减少失误。比较优秀的例如：MLX-LMPyReftlitgpt

llama3 微调教程之 llama factory 的安装部署与模型微调过程，模型量化和gguf转换。

失业求捞！

05-17

2万+

本文记录了从环境部署到微调模型、效果测试的全过程，以及遇到几个常见问题的解决办法，亲测可用（The installed version of bitsandbytes was compiled without GPU support. NotImplementedError: Architecture ‘LlamaForCausalLM’ not supported!