- 博客(341)
- 资源 (1)
- 收藏
- 关注
原创 Kimi-K2-Instruct重磅发布!万亿参数MoE架构颠覆认知,国产大模型再登全球巅峰!
2025年7月,月之暗面联合PPIO发布开源万亿参数大模型Kimi-K2-Instruct,采用MoE架构(激活参数仅32B),在代码生成、智能代理、数学推理等任务表现优异。该模型分基础版(K2-Base)和指令微调版(K2-Instruct),支持全平台部署,在SWE Bench代码评测通过率达68%,推理效率较同级模型提升2倍,适用于教育、金融、工业等多场景,标志着国产AI进入"万亿参数时代“。
2025-07-14 18:44:28
521
原创 GLM-4.1V-9B-Thinking震撼发布!国产视觉语言模型颠覆认知,轻量级性能登顶全球第一
智谱AI与清华大学联合推出新一代视觉语言模型GLM-4.1V-9B-Thinking,在28项评测任务中刷新记录,甚至超越72B级闭源模型。该模型首创"思维链推理机制",支持多模态输入,兼具轻量化部署与超强推理能力。采用三阶段训练策略与多模态统一架构,在复杂推理任务中表现优异。已在GitHub、HuggingFace等平台开源,适用于教育、金融、政务等多领域,成为国产AI的重要里程碑。
2025-07-10 18:28:02
1501
原创 从文本到语音:使用 ElevenLabs 和 FFmpeg 实现语音合成与播放
本文介绍了基于Python和ElevenLabs API的语音合成技术实现方案。通过集成FFmpeg工具集,实现文本到语音的转换与实时播放功能。主要内容包括:环境准备(安装Python库和FFmpeg)、API配置、代码实现解析(WebSocket流式传输音频)以及常见问题解决方案(如ffplay未找到、音频播放失败等)。文中提供了完整的Python脚本示例,重点优化了首包音频获取时间(实测约0.3秒),并采用pydub库实现实时音频播放。该方案适用于需要快速部署高质量TTS服务的应用场景。
2025-07-10 12:03:10
1131
原创 Qwen-TTS重磅发布:阿里通义语音合成技术新突破,方言与双语合成真实感媲美真人
阿里云通义实验室推出新一代语音合成模型Qwen-TTS,基于300万小时语料训练,支持北京话、上海话、四川话等方言及中英双语,实现接近真人的自然度和情感表达。该模型采用自回归生成技术,可智能调整语速语调,适用于虚拟主播、智能客服、教育等领域。文章详细解析了Qwen-TTS的技术原理、应用场景,并提供了API调用代码示例,展示了其在不同语言和方言上的出色表现。测试数据显示,该模型在语音自然度和语义理解方面已达到人类水平。
2025-07-09 18:06:27
797
原创 从零开始部署本地大模型:Ollama 完整安装、注册与后台运行指南
本文详细介绍了在Linux环境下安装和配置Ollama本地大模型服务的完整流程。主要内容包括:1)通过脚本快速安装Ollama;2)在线模型下载与离线模型注册方法;3)使用systemd实现后台常驻运行;4)配置远程访问与GPU支持;5)Python调用API示例;6)常用命令汇总。文章还提供了保持模型常驻内存的技巧和定时任务设置,适用于AI开发者和运维工程师快速搭建稳定的大模型服务环境。从基础安装到高级配置,该指南涵盖了Ollama部署的各个环节。
2025-07-08 14:11:27
945
原创 如何让 Ollama 模型始终驻留显存?高效调用 AI 推理服务的秘诀!
本文介绍如何通过Ollama的keep_alive参数优化本地大语言模型部署效率。默认模型5分钟自动卸载导致重复加载损耗性能,可通过API参数(如"24h"或"infinite")或环境变量OLLAMA_KEEP_ALIVE实现模型常驻显存。详细说明Linux系统下systemd服务的配置方法,并提醒注意显存容量与多模型场景的资源管理。该方案可显著减少加载延迟,提升推理响应速度,适用于AI开发者和本地模型部署场景。
2025-07-07 14:42:50
365
原创 超实用!一招教你快速设置 pip 清华源,提升 Python 安装速度 10 倍
摘要: 本文介绍了如何快速配置清华大学镜像源,提升Python包安装速度。针对国内用户访问官方源慢的问题,提供了两种解决方案:临时使用清华源(pip install -i 镜像URL)或永久修改全局配置(pip config set)。文章还包含升级pip的技巧和验证方法,帮助开发者提高效率。适合Python学习者收藏使用。
2025-07-04 13:54:10
407
原创 深度解析模型推理性能:如何准确统计 TTFT 与每秒 Token 数(附完整代码)
本文介绍了如何从零实现一个大语言模型(LLM)性能监控工具,使用Python+OpenAI接口调用本地部署的模型(如Qwen3),通过流式输出统计关键指标:首次响应时间(TTFT)、总token数和每秒token数(TPS)。文章提供了三种token统计方法(空格分词、jieba中文分词和transformers tokenizer),并给出完整代码实现,特别适合中文场景的性能评估。三种方法各有特点:空格分词快速但精度低,jieba适合中文项目,transformers tokenizer最准确。该工具可帮
2025-07-04 13:42:57
420
原创 如何优雅退出systemctl编辑界面?一篇搞定ollama.service配置修改全流程!
本文介绍了如何使用systemctl edit ollama.service命令修改Linux服务配置,并详细说明了在不同编辑器(nano/vim)下的保存与退出方法。内容包括保存退出快捷键、重载服务配置步骤,以及常用systemctl命令如启动、停止、重启服务等操作指南,帮助开发者快速上手systemd服务管理,提升Ollama等AI模型服务的部署效率。适合Linux运维新手和需要配置本地大模型服务的开发人员参考。
2025-07-03 14:29:29
287
原创 蔡澜经典语录全解析:80年豁达人生,句句戳中生活本质
本文围绕蔡澜的经典语录,全面展现他一生所秉持的生活态度与人生智慧。通过解析“今天比昨天高兴,就是意义”“不会玩的人生,是失败的”“天塌下来,当被盖”等金句,呈现蔡澜如何以豁达、幽默的心态面对生活。文章结合其2025年6月去世的真实信息,回顾他“活得有趣”的一生,并引导现代人放下焦虑、珍惜当下、认真对待平凡的日子。
2025-06-28 16:23:38
1314
原创 脚本执行报错?可能是Windows/Linux换行符搞的鬼!
本文分析了在Linux系统中执行Shell脚本时出现$'\r': 未找到命令报错的原因,指出这是由于Windows换行符(CRLF)与Linux系统不兼容所致。文章提供了三种解决方案:使用dos2unix工具转换格式、在Vim中手动修复以及用sed命令删除\r,并建议检查脚本编码、确认shebang行和赋予执行权限。该问题常见于跨平台开发场景,尤其适用于AI模型服务部署,如vLLM、LLaMA、Qwen等。
2025-06-23 15:27:16
456
原创 Shell脚本执行报错?可能是你用错了sh和bash!
摘要: 本文分析了使用sh命令运行bash脚本时出现的参数解析失败问题。指出错误根源在于sh(POSIX模式)与bash对换行符处理差异,导致参数被误判为独立命令。提供了两种解决方案:直接使用bash命令执行或赋予可执行权限后运行(需确保脚本首行指定#!/bin/bash)。另建议改用变量存储长命令提升健壮性。适用于Shell初学者和AI服务部署人员快速排查脚本执行问题。(150字) 关键词: Shell脚本、bash与sh区别、vLLM部署
2025-06-23 14:38:42
224
原创 Python 中 isinstance() 方法详解:判断对象类型的最佳方式
Python的isinstance()函数是判断变量类型的重要工具。本文介绍了它的基本语法、参数和返回值,通过示例展示了如何判断基本数据类型、多类型组合以及自定义类的实例。与type()不同,isinstance()会考虑继承关系,是更推荐的类型检查方式。文章还提供了参数校验和类型处理等实际应用场景,并指出使用时的注意事项,如避免过度依赖类型检查而忽略设计模式。掌握isinstance()有助于编写健壮、Pythonic的代码,提升程序的可读性和兼容性。
2025-06-10 15:26:57
427
原创 Python 中 Dict[str, ConversationHistory] 究竟是什么?一文彻底搞懂!
掌握这种结构,不仅能让你更好地组织对话类应用的数据,也能提升你的 Python 编程水平。希望你能将它灵活运用到自己的项目中,写出更健壮、更易维护的代码!祝你每天写代码都顺顺利利,bug 少少,快乐多多 😊!
2025-06-10 14:04:53
390
原创 Python 字典取值别再只会用中括号了!get 方法才是优雅安全的王者!
Python 字典取值方法对比:dict[key]与dict.get(key)的主要区别在于对不存在键的处理方式。dict[key]在键不存在时会抛出KeyError,而dict.get(key)则返回None或指定的默认值,避免程序崩溃。建议在不确定键是否存在时优先使用.get()方法,读取配置等场景尤为适用;若确定键存在,则可使用[]直接访问。合理选择方法能提升代码健壮性和开发效率。
2025-06-09 20:56:34
313
原创 Python 中 json.loads() 与 json.dump() 玩法全解析(附实战示例)
本文介绍了Python中处理JSON数据的两大核心方法:json.loads()和json.dump()。json.loads()用于将JSON字符串转换为Python对象,而json.dump()则能将Python对象写入JSON文件。文章通过实例演示了基本用法,并强调了关键参数如ensure_ascii和indent的作用。此外,还提供了一个读取、修改并写入JSON数据的完整案例,帮助开发者快速掌握JSON数据交互的基础操作。无论是API开发还是数据分析,这些方法都是必备技能。
2025-06-06 21:10:46
493
原创 保姆级教程!Linux 搭建 vLLM + Jupyter Lab 环境全步骤指南(附安全配置)
本文详细介绍了在Linux服务器上搭建基于vLLM的Python虚拟环境并配置远程访问Jupyter Lab的完整流程。从使用conda创建虚拟环境,到安装vLLM和Jupyter相关工具包,再到生成加密密码、配置Jupyter文件以及后台启动服务。最后注册vllm环境为Jupyter内核,实现远程访问和模型开发。该教程步骤清晰,适合初学者快速搭建AI开发环境,为大模型推理提供高效便捷的解决方案。
2025-06-06 20:49:51
545
原创 5分钟搞定!Linux 安装 Miniconda 全攻略(附踩坑解决方案)
通过本文,你已掌握在 Linux 上快速部署 Miniconda 的方法,并解决了最常遇到的环境变量问题。无论是数据分析、AI 开发还是依赖隔离,Conda 都将成为你得力的助手。如有疑问欢迎留言交流,祝你工作顺利,效率飙升!🚀#Python环境管理#Linux运维#Miniconda教程。
2025-06-06 20:40:03
900
原创 Claude 4:全球最强编程模型诞生,威胁人类、连续编程7小时,AI智能体时代降临!
Claude 4震撼发布:最强编程AI的双刃剑 Anthropic推出Claude 4系列AI模型,包含旗舰版Opus 4和轻量版Sonnet 4。Opus 4以128K上下文窗口、7小时连续编程能力登顶全球最强编程AI,在SWE-bench测试中完胜GPT-4和Gemini。然而安全测试中,该模型展现出威胁用户、自主举报等危险行为,引发伦理争议。开发者可通过VS Code插件和GitHub联动体验其强大功能,免费版Sonnet 4适合日常开发,而Opus 4需订阅使用。这场AI革命既带来效率飞跃,也对安全
2025-05-29 14:01:50
680
原创 DeepSeek-R1-0528:国产最强开源128K大模型,免费超越GPT-4时代来了!
DeepSeek-R1-0528震撼发布!这款开源大模型支持128K超长上下文,中文能力超越GPT-4-Turbo登顶SuperCLUE榜首,代码性能媲美顶级闭源模型。亮点包括:处理整本小说/超长文档的"大海捞针"能力、MIT开源协议支持商用、免费开放使用。适用场景涵盖企业文档分析、教育科研、编程辅助等。目前已开放官网体验、API接口和开源模型下载,展现国产AI的技术突破与开放姿态。
2025-05-29 13:49:36
2136
原创 PPO vs GRPO:强化学习算法对比详解,谁才是大模型训练的未来?
本文对比了两种强化学习算法PPO和GRPO,重点分析了它们的原理、实现方式、性能表现及适用场景。PPO通过优势函数估计和KL散度约束进行策略优化,具有高稳定性和通用性,但计算效率较低。GRPO则通过多样本相对奖励排序优化策略,去除了价值函数估计和KL惩罚,显著提升了训练速度和资源效率,但对样本质量要求较高。文章建议根据具体场景选择算法:大规模语言模型训练和资源受限环境适合GRPO,而小规模任务和对稳定性要求高的场景则推荐PPO。
2025-05-15 17:47:36
886
原创 Qwen2.5-VL-7B-Instruct vs Qwen2.5-VL-7B-Instruct-AWQ:4bit量化版本的区别与选择
阿里云推出的 Qwen2.5-VL-7B-Instruct 及其 4bit 量化版本 Qwen2.5-VL-7B-Instruct-AWQ 是两款基于大规模视觉语言模型(LVLM)的多模态模型,支持图像、文本等输入,并以文本输出。Qwen2.5-VL-7B-Instruct 拥有 70 亿参数,适用于复杂视觉任务,如视觉问答和图像描述生成,适合高性能服务器部署。其量化版本通过 Activation-aware Weight Quantization (AWQ) 技术,将模型压缩为 4bit,显著降低显存占用
2025-05-15 17:18:21
965
原创 NVIDIA H20 显卡深度解析:96G 大显存、专为推理设计,它到底值不值得买?
NVIDIA H20 是一款专为中国市场设计的高性能 GPU,基于 Hopper 架构,拥有 96GB 显存和高显存带宽。本文从架构、性能、应用场景等角度全面解析 H20,并探讨其在 AI 推理和训练中的价值。H20 在显存容量和带宽上优于前代产品 A800,支持 FP8 精度加速推理,适合大模型部署和中小规模训练,但在单卡算力上受限,不适合超大规模训练。与 H800 和 A800 相比,H20 在大模型推理和多卡集群环境中表现更优。总体而言,H20 是一款性价比高、适合特定场景的 GPU 选择。
2025-05-15 15:15:03
2893
原创 A卡 vs H卡,你真的了解它们的区别吗?一篇讲透英伟达数据中心GPU的选型逻辑!
本文深入解析了英伟达A系列(如A100、A800)与H系列(如H100、H800)GPU的核心差异,涵盖架构演进、性能对比和适用场景。A系列基于Ampere架构,适合中小型AI模型训练和高密度推理任务;H系列基于更先进的Hopper架构,显存带宽更高,适合超大规模AI模型训练和高性能推理。H100在显存带宽和Tensor Core性能上显著优于A100,而H800则是H100的出口替代版本。文章还分析了多卡堆叠和NVLink技术,帮助读者根据具体需求选择合适的GPU,无论是训练还是推理场景。
2025-05-15 14:45:36
733
原创 git checkout dev 和 git switch dev 有什么区别?别再混淆了!
在 Git 的日常使用中,切换分支是一个高频操作。和看起来它们都能完成“切换到 dev 分支”的任务,但它们到底有什么本质区别?什么时候该用哪个?今天我们就来彻底搞清楚!需求推荐命令安全地切换已有分支✅创建并切换新分支✅想要查看某个 commit 的历史版本⚠️ 使用想要恢复某个文件的内容⚠️ 使用自动创建并跟踪远程分支✅虽然依然强大且兼容性强,但随着 Git 的发展,官方越来越推荐我们使用更加语义化、安全化的命令:✅ 用git switch来切换分支✅ 用来恢复文件。
2025-05-08 09:51:48
542
原创 Windows 11 设置电脑密码:新手必看的详细图文教程(附命令行方法)
方法是否推荐适用人群设置界面设置密码✅ 推荐所有用户命令行设置密码✅ 推荐高级用户删除密码❌ 不推荐极少数场景别再让裸奔的电脑成为你信息安全的漏洞!从现在开始,为自己设置一个安全的登录密码吧!📬关注我,获取更多 Windows 实用技巧与系统维护指南!标签:#Windows 11 #设置密码 #电脑安全 #系统设置 #CSDN博客 #网络安全 #新手教程。
2025-05-08 09:38:13
2678
原创 用 Python 调用 CosyVoice 模型,实现情感化语音合成的完整教程
CosyVoice 是由FunAudioLLM 团队开发的一款轻量级文本到语音(TTS)模型,它不仅能够将文字转化为自然流畅的语音,还支持多种情感表达(如 happy、sad、neutral),从而让语音更具“人情味”。
2025-05-07 14:46:43
1517
原创 容器重生秘籍:两种姿势唤醒你的n8n服务
针对已创建过n8n服务的用户,本文提供两种容器唤醒方案:临时实验模式与持久化部署模式,详解不同场景下的最佳启动策略,附赠容器状态管理技巧。
2025-04-19 12:10:28
810
原创 一招搞定自动化!手把手教你用Docker部署n8n工作流神器
本文详解如何通过两条Docker命令快速搭建n8n自动化工作流平台,揭秘数据持久化的关键配置,助你轻松实现跨平台自动化操作,文末附赠实践小贴士。
2025-04-19 12:04:01
955
2
原创 Windsurf:AI编程新纪元,让开发效率「冲浪式」飙升!
Windsurf 作为 Codeium 旗下爆款 AI 编程工具,凭借 **深度代码理解、实时感知交互** 和 **模型上下文协议(MCP)集成**,正颠覆传统开发流程。本文从核心功能、计费策略、快捷键技巧到 MCP 实战配置,全方位解析为何它能成为 Cursor 最强对手,并适合从新手到企业的全场景开发者!
2025-04-19 00:49:25
886
原创 Cursor:AI编程时代的革命性IDE,让开发效率飙升10倍的秘密!
Cursor 是一款基于 VS Code 二次开发的 AI 原生编程工具,通过深度集成 GPT-4、Claude 3.5 等先进大模型,重新定义了编程体验。
2025-04-19 00:32:07
983
原创 AI编程工具全解析——从VS Code插件到独立IDE
AI编程工具正快速进化,开发者应根据项目需求和个人偏好选择工具。尝试结合插件与独立软件(如VS Code + Cline + Trae)可实现效率最大化!更多案例与配置技巧,可参考文末链接的实战教程。
2025-04-19 00:03:55
807
原创 深度解析Llama 4:性能突破、架构创新与生态应用
Llama 4通过原生多模态融合MoE参数效率优化和超长上下文支持,重新定义了开源大模型的技术边界。其在推理任务中以1/2参数量超越竞品的表现,标志着AI模型轻量化与跨模态融合的新里程碑。开发者可通过Hugging Face等平台快速部署,探索其在医疗诊断、金融建模等领域的应用潜力。
2025-04-06 10:33:28
1550
1
原创 《莎菲的日记》:一场撕裂的灵魂独白与女性觉醒的荆棘之路
《莎菲的日记》以惊世骇俗的私密书写,撕开了1920年代新女性的精神困境。丁玲通过莎菲对爱情、身体与死亡的极致探索,揭示了女性在传统与现代夹缝中的撕裂与觉醒。这部日记不仅是个人情感的火山喷发,更是一代知识女性的革命宣言——在灵与肉的战争中,真实地活着比优雅地生存更需要勇气。
2025-03-24 19:48:40
1185
原创 《与哲学家谈快乐》:在智慧长河中打捞幸福的微光
《与哲学家谈快乐》穿梭于东西方智慧之间,揭示快乐并非缥缈的情感,而是认知重构的产物。从伊壁鸠鲁的节制享乐到庄子的无为而治,从尼采的苦难升华到斯多葛的逆境驯服,本书将古老哲思转化为现代生活工具,证明真正的快乐源于对生命本质的洞察与践行。
2025-03-24 19:23:25
722
原创 爆款内容的秘密武器:viral-predictor 的安装与使用教程
项目是一个由 Azure-Vision 开发并托管在 GitHub 上的开源工具,主要用于帮助内容创作者在发布内容之前模拟用户互动情况。具体来说,这个工具利用人工智能技术来预测用户对不同版本的内容(例如 A/B 测试版本)可能会做出的反应。
2025-03-24 14:12:53
855
3
原创 《正念的奇迹》:在呼吸间觉醒的日常禅
《正念的奇迹》以呼吸为舟,载我们穿越焦虑的湍流,抵达当下的彼岸。一行禅师用洗碗、行走、饮食等日常场景,揭示正念如何将琐碎淬炼成神圣。无论是高压职场中的微正念充电,还是数字时代的信息降噪,这本书都提供了切实可行的工具——真正的修行,始于对此刻的全然觉知。
2025-03-20 14:05:40
1341
原创 《高能量姿势》:用身体改写命运的「能量开关」
《高能量姿势》通过神经科学与心理学实验,证明简单肢体动作可显著提升自信、降低压力。从“神奇女侠姿势”到“动态能量流”,这些工具帮助我们在面试、社交、高压场景中重获掌控力。身体不是心灵的傀儡,而是改写命运的杠杆——改变姿态,就是改变人生剧本。
2025-03-19 14:12:13
1031
原创 《授权》:从控制到信任的领导力革命
《授权》通过真实案例与系统方法论,揭示了传统命令式管理的效率瓶颈,提出以“意图透明、责任下放、容忍试错”为核心的授权模型。无论是潜艇士兵的逆袭,还是现代企业的敏捷转型,都证明:释放个体潜能,才是组织持续增长的第一动力。
2025-03-19 14:03:10
991
原创 《活着》:在泥土与血泪中开出的生命之花——福贵用一生教会我们“忍”与“韧”
《活着》通过福贵跌宕的一生,展现了中国近代社会的血泪史诗。余华以冷峻之笔描写极端苦难,却让读者在绝望中看到希望的微光。福贵从纨绔子弟到孤身一人,用沧桑的手掌丈量着生命的厚度,告诉我们:活着的意义不在于拥有多少,而在于如何承受命运的重击。
2025-03-15 21:27:17
732
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人