
开源大语言模型-qwen模型小试
文章平均质量分 94
开启智慧新纪元:深入探索 qwen 系列模型,在这里,你会看到 qwen 如何以惊人的智慧和效率解决复杂问题,无论是语言理解、知识问答还是创意生成,它都能轻松应对。通过详细的案例分析和实用的技巧分享,你将快速掌握 qwen 系列模型的使用方法,成为人工智能领域的高手。
开源技术探险家
非计算机专业出身人士,但于2009年毅然投身IT行业。迄今,拥有15年的开发经验以及10年的项目管理经验。曾先后参与金融、政企、互联网等多个行业领域的数十个项目。对分布式架构、微服务技术以及大数据领域的知识掌握娴熟。当前,致力于人工智能(AI)方向的深入探索,所负责的项目已顺利完成大语言模型和算法的备案工作。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
开源模型应用落地-qwen模型小试-Qwen3-8B-快速体验(一)
阿里云推出国内首个集成“快思考”与“慢思考”能力的 Qwen3-8B 大语言模型,以80亿参数和 128K 上下文支持,重塑AI应用边界并助力开发者高效部署原创 2025-04-29 14:08:11 · 21459 阅读 · 9 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-快速体验-pipeline方式(二)
阿里云推出国内首个集成“快思考”与“慢思考”能力的 Qwen3-8B 大语言模型,以80亿参数和 128K 上下文支持,重塑AI应用边界并助力开发者高效部署原创 2025-04-30 18:33:59 · 20427 阅读 · 9 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-快速体验-批量推理(三)
使用Transformers的pipeline实现批量推理原创 2025-05-05 13:51:38 · 14276 阅读 · 8 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM(一)
解析Qwen3-8B与vLLM的技术协同逻辑,探讨其在复杂任务中的性能表现及落地价值。原创 2025-05-05 16:01:11 · 14207 阅读 · 10 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-Docker(二)
通过容器化技术整合高性能推理框架vLLM与Qwen3-8B模型,可实现资源高效利用、灵活部署及推理性能优化,为大模型本地化应用提供轻量化解决方案原创 2025-05-06 07:34:21 · 28703 阅读 · 10 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-结构化输出(三)
通过vLLM框架高效部署QWen3-8B模型,并优化提示词工程与输出控制,实现稳定的结构化JSON生成,从而提升推理效率并拓展大模型应用场景。原创 2025-05-06 07:35:24 · 28087 阅读 · 9 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-思考与非思考模式(四)
Qwen3通过“思考模式”与“非思考模式”的双模态架构,实现复杂推理与实时响应的灵活切换,为大语言模型在智能与效率间的平衡提供创新解法。原创 2025-05-07 08:30:00 · 27062 阅读 · 12 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-Tools助力(五)
在人工智能大模型迅速发展的今天,如何让模型更智能地与外部世界交互,成为提升其实际应用能力的关键。原创 2025-05-08 08:30:00 · 26431 阅读 · 12 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-推理加速-vLLM-MCP的完美融合(六)
Qwen3-8B接入MCP,实现动态地连接外部工具和服务,从而极大地增强了其处理复杂任务的能力。原创 2025-05-09 07:45:00 · 22896 阅读 · 6 评论 -
开源模型应用落地-qwen模型小试-Qwen3-8B-融合VLLM、MCP与Agent(七)
Qwen3凭借其智能体能力、MCP协议支持与高效部署特性,正加速在金融、制造、科研等多个企业场景中的落地应用,推动智能化转型与业务闭环构建。原创 2025-05-13 10:23:49 · 30685 阅读 · 11 评论 -
开源模型应用落地-qwen模型小试-Qwen3-Reranker 模型集成 vLLM 实战解析(一)
本文介绍了将Qwen3-Reranker模型集成至高效推理引擎vLLM的技术方案,旨在提升大模型在信息爆炸时代下的排序效率与应用落地能力。原创 2025-07-15 18:29:20 · 5503 阅读 · 4 评论 -
开源模型应用落地-qwen模型小试-Qwen3-Embedding 模型集成 vLLM 实战解析(二)
Qwen3-Embedding凭借卓越的多语言理解和文本表征能力,结合vLLM框架实现高效推理,推动语义检索和生成任务迈向新高度。原创 2025-07-16 19:30:00 · 4800 阅读 · 11 评论 -
开源模型应用落地-qwen模型小试-入门篇(二)
在windows环境下,使用transformer设置模型参数/System Prompt/历史对话原创 2024-01-15 15:17:12 · 2750 阅读 · 40 评论 -
开源模型应用落地-qwen模型小试-入门篇(三)
在linux环境下,基于GPU,使用transformer调用Qwen-1_8B-Chat原创 2024-01-17 09:30:00 · 2110 阅读 · 46 评论 -
开源模型应用落地-qwen模型小试-入门篇(四)
使用gradio,构建Qwen-1_8B-Chat测试界面原创 2024-01-19 09:30:00 · 1721 阅读 · 44 评论 -
开源模型应用落地-qwen模型小试-入门篇(五)
使用modelscope api调用Qwen-1_8B-Chat模型,实现非流式/流式输出原创 2024-01-20 09:30:00 · 1866 阅读 · 30 评论 -
开源模型应用落地-qwen模型小试-调用qwen1.5新模型-进阶篇(六)
Qwen1.5系列模型的新特性及使用方式原创 2024-02-26 14:22:33 · 2393 阅读 · 20 评论 -
开源模型应用落地-qwen模型小试-调用Lora模型-进阶篇(七)
调用微调后的qwen-7b-chat模型原创 2024-03-14 14:45:47 · 2967 阅读 · 25 评论 -
开源模型应用落地-qwen模型小试-合并Lora模型-进阶篇(八)
qwen-7b-chat基座模型与微调后的lora模型进行合并原创 2024-03-15 14:26:44 · 1861 阅读 · 30 评论 -
开源模型应用落地-qwen模型小试-Zero/One/Few Shot-进阶篇(九)
理解何为Zero-Shot/One-Shot/Few-Shot,以及如何正确使用原创 2024-03-20 12:21:59 · 2154 阅读 · 24 评论 -
开源模型应用落地-qwen模型小试-function call(十)
学习如何使用在qwen1.5-7b-chat模型下,实现Function Call的功能原创 2024-05-12 08:30:00 · 20608 阅读 · 28 评论 -
开源模型应用落地-qwen模型小试-Qwen-Agent(十一)
在qwen1.5-7b-chat模型下,利用Qwen-Agent构建智能代理,以理解和响应用户查询原创 2024-05-13 13:39:17 · 20754 阅读 · 31 评论 -
开源模型应用落地-qwen模型小试-调用Qwen2-7B-Instruct-进阶篇(十二)
Qwen2系列模型的新特性及使用方式原创 2024-06-11 18:45:45 · 47570 阅读 · 27 评论 -
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-快速体验(十三)
Qwen2.5系列模型的新特性及使用方式原创 2024-09-20 14:31:35 · 28692 阅读 · 26 评论 -
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-Gradio快速体验(十四)
Qwen2.5-7B-Instruct集成Gradio和vLLM原创 2024-09-20 17:10:32 · 23104 阅读 · 20 评论 -
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-tool usage入门-Qwen-Agent初体验(一)
使用Qwen-Agent 为开发者提供了一个强大的工具,更方便地开发出具有各种功能的智能应用程序原创 2024-11-12 18:04:18 · 4848 阅读 · 45 评论 -
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-tool usage入门-集成心知天气(二)
使用Qwen-Agent 集成心知天气获取实时天气信息原创 2024-11-13 11:27:49 · 5334 阅读 · 45 评论 -
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-tool usage入门-串行调用多个tools(三)
在Qwen-Agent中实现多个tools联动原创 2024-11-13 12:26:42 · 7214 阅读 · 38 评论 -
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-tool usage入门-Qwen-Agent深入学习(四)
Qwen-Agent深入学习原创 2024-11-14 12:16:22 · 6758 阅读 · 30 评论 -
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-tool usage入门-并行调用多个tools(五)
在Qwen-Agent中并行调用多个tools原创 2024-11-14 16:39:16 · 7115 阅读 · 41 评论 -
开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-LangGraph-链式处理(一)
Qwen2.5系列模型凭借卓越的推理能力,在 LangGraph 的多节点处理中展现出重要价值,进一步释放了大语言模型在复杂任务中的潜力。原创 2025-01-24 12:29:16 · 10648 阅读 · 18 评论 -
开源模型应用落地-qwen-7b-chat-LoRA微调(一)
使用QWen官方方式微调qwen-7b-chat模型原创 2024-03-27 15:42:03 · 2684 阅读 · 31 评论 -
开源模型应用落地-qwen1.5-7b-chat-LoRA微调(二)
使用QWen官方方式微调qwen1.5-7b-chat模型原创 2024-03-28 18:57:02 · 2834 阅读 · 25 评论 -
开源模型应用落地-qwen-7b-chat-LoRA微调-Firefly(三)
使用开源的Firefly大模型训练项目微调qwen-7b-chat模型原创 2024-04-01 08:30:00 · 14458 阅读 · 31 评论 -
开源模型应用落地-qwen1.5-7b-chat-LoRA微调-Firefly(四)
使用开源的Firefly大模型训练项目微调qwen1.5-7b-chat模型原创 2024-04-02 08:30:00 · 14992 阅读 · 35 评论 -
开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡(五)
使用LLaMA-Factory高效微调qwen2-7b-instruct原创 2024-08-10 08:30:00 · 41074 阅读 · 42 评论 -
开源模型应用落地-qwen2-7b-instruct-LoRA微调&模型合并-LLaMA-Factory-单机多卡-RTX 4090双卡(六)
使用LLaMA-Factory合并微调后的模型权重原创 2024-08-16 12:09:23 · 21866 阅读 · 36 评论 -
开源模型应用落地-qwen2-7b-instruct-LoRA微调-Axolotl-单机多卡-RTX 4090双卡(七)
使用Axolotl高效微调qwen2-7b-instruct原创 2024-08-16 18:20:57 · 12757 阅读 · 36 评论 -
开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机单卡-V100(八)
使用LLaMA-Factory高效微调qwen2-7b-instruct原创 2024-08-21 16:59:59 · 8435 阅读 · 24 评论 -
开源模型应用落地-qwen2-7b-instruct-LoRA微调-Axolotl-单机单卡-V100(九)
使用Axolotl高效微调qwen2-7b-instruct原创 2024-08-22 22:17:52 · 7557 阅读 · 18 评论