【LLM】通义千问Qwen2-7b-instruct部署

Geek-Banana

已于 2024-09-23 15:50:17 修改

阅读量909

点赞数 4

CC 4.0 BY-SA版权

文章标签：深度学习人工智能语言模型通义千问大模型 python 算法

于 2024-09-09 23:34:10 首次发布

本文链接：https://blog.csdn.net/qq1515312832/article/details/142071235

前言

https://www.modelscope.cn/models/qwen/Qwen2-7B-Instruct
其实完全可以按照这个介绍来装，不过容易遇到一些问题，新学习，也是记录一下

环境

python 3.10

在自己电脑上用conda创建一个新环境
找租用的服务器租一台，3090一小时也就一两块钱

我个人是租的服务器来运行的

具体步骤

安装依赖

pip install transformers==4.37.0 accelerate tiktoken einops scipy transformers_stream_generator==0.0.4 peft deepspeed

pip install modelscope

假如说，依赖的包找不到，可以从网上找到zip或者tar，通过绝对地址来进行安装

pip install 包的绝对路径

模型下载

我没有预先下载模型，完全通过代码自动下载的，快慢主要受限于网速，我在服务器上下载模型很快，十分钟左右就下好了。

from modelscope import AutoModelForCausalLM, AutoTokenizer
device = "cuda" # the device to load the model onto

model = AutoModelForCausalLM.from_pretrained(
    "qwen/Qwen2-7B-Instruct",
    torch_dtype="auto",
    device_map="auto"
)

生成tokenizer

tokenizer = AutoTokenizer.from_pretrained("qwen/Qwen2-7B-Instruct")

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Geek-Banana

关注关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡（五）

以微薄之力，予他人些许温暖.

08-10

4万+

使用LLaMA-Factory高效微调qwen2-7b-instruct

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

老牛啊

06-12

1万+

阿里云正式开源通义千问Qwen2系列模型，其中Qwen2-72B成为全球性能最强的开源模型，在全球权威测评中，性能超过美国最强开源模型Llama3-70B，也超过文心4.0、豆包pro、混元pro等众多中国闭源大模型。今天老牛同学部署和体验Qwen2-7B中等尺寸模型，包括本地部署、API嗲用和WebUI对话客户端……

参与评论您还未登录，请先登录后发表或查看评论

使用 vllm 本地部署 cohere 的 command-r

engchina的专栏

04-24

1247

使用 vllm 本地部署 cohere 的 command-r

[大模型]Yi-6B-chat WebDemo 部署

FL1623863129的博客

04-13

927

由60亿个参数组成的高级语言模型 Yi LLM。为了促进研究，Yi 已经为研究社区开放了Yi LLM 6B/34B Base 和 Yi LLM 6B/34B Chat。

[大模型]Qwen2-7B-Instruct vLLM 部署调用

FL1623863129的博客

06-15

1万+

vLLM框架是一个高效的大语言模型vLLMKVvLLMvLLMOpenAIAPIGPUvLLM在AutoDL平台中租赁一个 3090 等 24G 显存大小的容器实例，镜像选择如下PyTorch→2.1.0→→12.1接下来打开本地设备终端使用ssh的方式访问，在终端中依次复制登录指令和密码完成登录ssh登录成功后的界面如图所示👇或者也可以直接打开AutoDL网页端的快捷工具中选择JupyterLab并在其中点击终端打开（这种方式不需要验证🫠）接下来开始环境配置、模型下载和运行演示 ~pip。

[大模型]Qwen2-7B-Instruct 接入 LangChain 搭建知识库助手

FL1623863129的博客

06-15

2664

在上述类定义中，我们分别重写了构造函数和 _call 函数：对于构造函数，我们在对象实例化的一开始加载本地部署的 Qwen2 模型，从而避免每一次调用都需要重新加载模型带来的时间过长；_call 函数是 LLM 类的核心函数，LangChain 会调用该函数来调用 LLM，在该函数中，我们调用已实例化模型的 generate 方法，从而实现对模型的调用并返回调用结果。完成自定义 LLM 类之后，可以以完全一致的方式调用 LangChain 的接口，而无需考虑底层模型调用的不一致。

Qwen2-7B-Instruct 的 model-00004-of-00004.safetensors 的2/2

07-26

Qwen2-7B-Instruct 的 model-00004-of-00004.safetensors 的2/2

qwen2.5-7b 部署

11-15

标题 "qwen2.5-7b 部署" 暗示本文将详细讨论关于名为 "qwen2.5-7b" 的软件或系统部署过程中的必要步骤和技术细节。从给定的文件信息来看，该部署过程涉及到一系列复杂的依赖关系和依赖文件的管理。部署所依赖的文件...

Qwen2-7B-Instruct 的 model-00003-of-00004.safetensors 的2/2

07-26

Qwen2-7B-Instruct 的 model-00003-of-00004.safetensors 的2/2

[大模型]Qwen2-7B-Instruct FastApi 部署调用

FL1623863129的博客

06-15

1143

在 /root/autodl-tmp 路径下新建 model_download.py 文件并在其中输入以下内容，粘贴代码后请及时保存文件，如下图所示。使用 modelscope 中的 snapshot_download 函数下载模型，第一个参数为模型名称，参数 cache_dir 为模型的下载路径。接下来，我们打开刚刚租用服务器的 JupyterLab，如下图所示，然后打开其中的终端，开始环境配置、模型下载和运行演示。下面的代码有很详细的注释，大家如有不理解的地方，欢迎提出 issue。

LLM大模型：QWen2-72B-Instruct模型安装部署过程

2301_81940605的博客

08-12

3727

最近在给我们的客户私有化部署我们的TorchV系统，客户给的资源足够充裕，借此机会记录下部署千问72B模型的过程，分享给大家！

[大模型]Qwen2-7B-Instruct Lora 微调

FL1623863129的博客

06-15

4187

LoraConfig这个类中可以设置很多参数，但主要的参数没多少，简单讲一讲，感兴趣的同学可以直接看源码。task_type：模型类型：需要训练的模型层的名字，主要就是attention部分的层，不同的模型对应的层的名字不同，可以传入数组，也可以字符串，也可以正则表达式。rlora的秩，具体可以看Lora原理lora_alphaLora alaph，具体作用参见Lora原理Lora的缩放是啥嘞？当然不是r（秩），这个缩放就是, 在这个LoraConfig中缩放就是4倍。

【亲测免费】 Qwen2-7B-Instruct 简介：基本概念与特点

gitblog_02488的博客

12-10

1005

Qwen2-7B-Instruct 简介：基本概念与特点引言随着人工智能技术的飞速发展，大规模语言模型在自然语言处理领域中的应用日益广泛。Qwen2-7B-Instruct 作为 Qwen 系列语言模型中的一员，以其卓越的性能和广泛的应用前景，受到了业界的广泛关注。本文旨在介绍 Qwen2-7B-Instruct 的基本概念、技术特点及其在自然语言处理任务中的应用优势。模型的背景 Qwen2...

Windows微调Qwen2-7B-Instruct-甄嬛

Fightever_的博客

08-23

1617

zip(model_inputs.input_ids,generated_ids)是将这两部分打包成元组列表，每个元组包含两个列表中对应位置的元素，这样，就可以在列表推导式中同时遍历输入令牌和生成的令牌。最后，output_ids[len(input_ids):] for input_ids,output_ids in zip(model_inputs.input_ids,generated_ids)是列表推导式，他提取outpu_ids中新生成的token，并将这些部分收集到新列表。

【Qwen2微调实战】Lora微调Qwen2-7B-Instruct实践指南_qwen2 lora

HUANGXIN9898的博客

04-14

646

Lora微调是一种基于低秩矩阵的微调方法，它通过在模型的权重矩阵中引入低秩结构来减少参数数量，从而降低模型的存储和计算需求。这种方法在保持模型性能的同时，显著提高了模型的灵活性和适应性。Qwen2-7B-Instruct，一款精心设计的高级预训练语言模型，拥有70亿参数，专注于提升对指令性文本的精准理解和高效生成。它在自然语言处理（NLP）的多个专业领域中，如文本摘要、情感分析、机器翻译等，均展现出了卓越的处理能力和适应性。

Qwen2-7B-Instruct：常见错误及解决方法

gitblog_02800的博客

12-30

708

Qwen2-7B-Instruct：常见错误及解决方法在使用Qwen2-7B-Instruct模型的过程中，用户可能会遇到各种错误。这篇文章将帮助你识别和解决这些常见错误，确保你能够顺利地部署和使用这个强大的语言模型。引言错误排查是任何技术工作的重要组成部分，特别是在处理复杂的语言模型时。了解常见的错误及其解决方法，可以帮助用户节省时间，避免重复的挫败感，并提高工作效率。本文旨在提供一个详细...

开源模型应用落地-qwen2-7b-instruct-LoRA微调-ms-swift-单机多卡-RTX 4090双卡（十四）

以微薄之力，予他人些许温暖.

09-01

4101

使用ms-swift高效微调qwen2-7b-instruct

怎么在Windows操作系统部署阿里开源版通义千问（Qwen2）

weixin_34008445的博客

09-12

374

怎么在Windows操作系统部署阿里开源版通义千问（Qwen2） | 原创作者/编辑：凯哥Java | 分类：人工智能学习系列教程 GitHub上qwen2截图随着人工智能技术的不断进步，阿里巴巴通义千问团队近期发布了Qwen2系列开源模型，这一系列模型在多个领域展现出卓越的性能，特别是在自然语言理解、知识、代码、数学及多语言等能力...

【Qwen2微调实战】Lora微调Qwen2-7B-Instruct实践指南