LLMFactory对qwen模型进行微调-甄嬛传版

最新推荐文章于 2025-08-22 23:47:35 发布

大米2H

最新推荐文章于 2025-08-22 23:47:35 发布

阅读量330

点赞数 3

CC 4.0 BY-SA版权

文章标签： python llama

本文链接：https://blog.csdn.net/m0_57446978/article/details/149413900

🧾 1. 基础配置

✅ 1.1安装 Python（建议 3.10 或 3.11）

首先在合适的位置使用cmd命令创建python虚拟环境
在这里插入图片描述

✅ 1.2 创建虚拟环境

# 在你项目的目录下运行
python -m venv llama_env
llama_env\Scripts\activate  # 激活虚拟环境

✅ 1.3安装依赖

先升级pip

python -m pip install --upgrade pip

✅ 1.4 然后安装 PyTorch：

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

✅ 1.5 若使用 CPU-only：

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

pip install -e ".[torch,metrics]"  # 可选装 metrics，如果报错可去掉
pip install transformers datasets peft accelerate

🧾 2. LLM Factory源码的下载

2.1 离线版方法

https://github.com/hiyouga/LLaMA-Factory/tree/main
在这里插入图片描述

2.1 在线版（容易失败）

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

🧾 4. 下载模型（以 Qwen 为例）

https://huggingface.co/Qwen/Qwen1.5-1.8B-Chat/tree/main
在这里插入图片描述

通过 Hugging Face 下载 Qwen 模型（如 Qwen/Qwen1.5-1.8B-Chat）
下载后将其放到本地路径，如：D:\models\Qwen1.5-1.8B-Chat

📝 6. 准备数据集（Alpaca / ChatML 格式）

https://www.modelscope.cn/datasets/kmno4zx/huanhuan-chat/files
下载嬛嬛的json文件
在这里插入图片描述

📝 7. 将新的json数据集配置进dataset_info

位置如下
D:\2025 Project\Ollama_Testing\LLaMA-Factory\data\dataset_info.json
在这里插入图片描述

📝 8. 在虚拟的python环境输入指令进入llm factory

python src/webui.py

📝 9. 在虚拟的python环境输入指令进入llm factory

9.1选择你的模型
9.2选择数据集
9.3开始训练
9.4开始训练
9.5训练成功后导出模型

📝 10. 将导出的模型再导入llm factory

在这里插入图片描述

📝 11. 开始跟你的嬛嬛聊天