又是属于国产 AI 的一周!
📢本周AI快讯 | 1分钟速览🚀
1️⃣ 🎯 DeepSeek-V3.1 正式发布 :开启 AI Agent 新篇章,支持“思考”与“非思考”双模式,deepseek-chat
和 deepseek-reasoner
API 同步上线,128K 上下文支持。
2️⃣ 🇨🇳 DeepSeek 适配国产芯片 :首次公开 UE8M0 FP8 精度格式,专为国产下一代 AI 芯片设计,节省 50%-75% 显存,加速软硬一体化突破。
3️⃣ ☁️ 智谱 AutoGLM 2.0 发布 :全球首个云端手机 Agent,AI 获得“专属手机”在云端独立执行任务,已支持 40+ 常用 App 远程操作。
4️⃣ ⚡ Kimi K2 Turbo 大提速 :输出速度飙升至 100 Tokens/s,基于 MoE 架构的 kimi-k2-turbo-preview
生成效率提升 40%,5 折优惠持续至 9 月 1 日。
5️⃣ 💻 腾讯 CodeBuddy 公测 :国内首个支持 DeepSeek-V3.1-Think
的 AI IDE,集成多款主流模型,实现“一句话编程”全流程闭环。
6️⃣ 🔧 阿里发布 Qoder 平台 :Agentic 编程新范式,一次检索 10 万个代码文件,将电商网站开发从数天压缩至十分钟,引入 Quest Mode 自主开发。
7️⃣ 💰 ChatGPT Go 印度上线 :OpenAI 推出 399 卢比/月(约 32.8 元)低价订阅,提供 10 倍消息上限,支持 GPT-5
模型,瞄准新兴市场。
8️⃣ 🚀 Sam Altman 转型战略 :Fidji Simo 任 ChatGPT CEO 负责日常运营,Altman 专注超级智能研发,OpenAI 完成 83 亿美元融资,估值达 3000 亿。
9️⃣ 👁️ Gemini Live 视觉升级 :谷歌 Pixel 10 首发实时视觉交互,AI 可在屏幕上高亮标注实物,与日历、地图等应用深度集成。
🔟 ⚠️ Grok 提示词泄露 :xAI 意外曝光“疯狂阴谋论者”等争议角色设定,引发 AI 伦理边界讨论,凸显大模型安全挑战。
01|DeepSeek-V3.1 正式发布,开启 AI Agent 新篇章
8 月 21 日,DeepSeek 正式发布新一代大模型 DeepSeek-V3.1
,作为继 DeepSeek-V3
和 DeepSeek-R1
后的重要迭代,该版本标志着 DeepSeek 正式迈入 AI Agent 时代。V3.1
为混合模型,支持“思考”与“非思考”两种模式,具备更强泛化能力与多场景适配性。
此次升级重点体现在三方面:一是引入混合推理架构,用户可通过“深度思考”按钮自由切换推理模式;二是显著提升思考效率,V3.1-Think
在输出 token 减少 20%-50% 的同时,整体任务表现仍与 R1-0528
持平;三是通过后训练优化增强 Agent 能力,在工具调用和任务执行方面表现更稳健。
在 SWE 修复测试、终端操作任务(Terminal-Bench)、复杂搜索(browsecomp)及跨学科难题(HLE)中,DeepSeek-V3.1
较 R1
系列取得全面性能提升。API 层面也同步升级:非思考模式对应 deepseek-chat
,思考模式对应 deepseek-reasoner
,支持最长 128K 上下文,并引入 strict Function Calling 确保输出结构合规。此外,API 已兼容 Anthropic 格式,方便集成至 Claude Code 体系。
02|DeepSeek 预告国产芯片适配,UE8M0 FP8 精度引发关注
8 月 21 日,DeepSeek 发布新一代大模型 DeepSeek-V3.1
,并首次公开其采用 UE8M0 FP8 Scale 参数精度格式。更引人注目的是,DeepSeek 官方在社交平台留言确认:UE8M0 FP8 是专为即将发布的国产下一代 AI 芯片设计,引发行业热议。
UE8M0 FP8 是一种创新的低精度数值格式,其中 UE 表示无符号 8 位指数(E8M0),配合独立缩放机制,在保持计算稳定性的同时,大幅降低显存占用。相较传统 FP16/FP32,FP8 能节省 50%–75% 显存,在 NVIDIA H800 GPU 上矩阵运算速度快 2–3 倍。UE8M0 精度格式设计中,每 32 个 FP8 数据仅需附加 8bit 缩放信息,远低于传统 FP32 的 4 字节开销。
多家国产芯片厂商已布局 FP8 原生支持,包括摩尔线程(MUSA 3.1 GPU)、芯原(VIP9000 NPU)等,计划于 2025 年下半年首发产品,并与 DeepSeek、华为等 15 家企业完成联合验证。摩尔线程作为首个支持原生 FP8 的国产 GPU 厂商,构建了完整的 MUSA 3.1 架构,并获得和而泰 1.244% 股权投资。
分析认为,DeepSeek 借助 UE8M0 主动对齐国产硬件的性能特征,正加速构建“国产芯片—国产模型—国产应用”闭环生态,助推 AI 自主技术实现软硬一体化突破。
03|智谱发布 AutoGLM 2.0,全球首个云端手机 Agent 登场
8 月 20 日,智谱发布 AutoGLM 2.0,作为全球首个 Phone-Use AI Agent 的重磅升级版本,首次实现“Agent + 云手机/云电脑”新范式。该架构使 AI 智能体可在云端独立完成任务,无需占用用户本地设备资源,为 AI Agent 技术带来结构性变革。
核心创新在于云执行模式:AI 被分配“专属手机或电脑”,在不干扰用户正常使用的前提下,可后台完成任务。当前 AutoGLM 已支持远程操作抖音、小红书、美团、京东等 40+ 常用 App。智谱 CEO 张鹏表示,未来个人竞争力将是“自身能力 + N 个 AI 智能体”的总和。
技术上,AutoGLM 由最新语言模型 GLM-4.5
与多模态模型 GLM-4.5V
驱动,并采用端到端在线强化学习路线,提升在真实环境中的任务执行力。在 Device Use 测试中,其表现优于 ChatGPT Agent
、UI-TARS-1.5
与 Claude Sonnet 4
,展现出更强的鲁棒性与泛化能力。
AutoGLM 的控制能力已封装为 API,开发者可将其嵌入各类设备,从 AI 眼镜到智能家居均可接入。移动端 API 与生态共建计划现已开放,后续还将推出“定时任务”功能,实现 AI 智能体主动规划与执行,例如每天 9 点自动整理未读邮件并推送摘要至微信,推动 Agent 从响应式向主动型演进。
04|Kimi K2 Turbo 提速至 100 Tokens/s,长文生成效率飙升
8 月 22 日,月之暗面宣布其高速模型 kimi-k2-turbo-preview
再度实现重大突破:输出速度由此前的 60 Tokens/s 提升至峰值 100 Tokens/s,创下该系列新高。这一成果得益于团队在系统调优与底层工程上的持续优化。
早在 8 月 1 日发布初版高速版 Kimi K2
时,模型输出速度便已从每秒 10 Tokens 提升至 40 Tokens,实现了 4 倍跃升。Kimi K2
基于混合专家(MoE)架构打造,具备 1 万亿总参数与 320 亿激活参数,在前沿知识、数学、编码等任务中展现出非思考类模型中的 SOTA 表现。
定价方面,Kimi K2 Turbo
目前仍享受 5 折优惠,具体价格如下:输入(缓存命中)2 元/百万 tokens,输入(未命中)8 元,输出为 32 元,优惠期持续至 9 月 1 日。实测结果显示,该模型生成一篇 2000 字的技术分析文章仅需 2 分钟,生成效率较旧版本提升约 40%,显著加速了长文本撰写与代码生成等复杂任务流程。
05|腾讯 CodeBuddy 开放公测,首发接入 DeepSeek-V3.1
8 月 22 日,腾讯云正式开放 CodeBuddy IDE 国内版公测,用户现可无邀请码免费体验这一集成多模型的 AI 编程平台。新版支持包括 DeepSeek-V3.1-Think
、DeepSeek-V3-0324
、DeepSeek-R1-0528
及 hunyuan-turbos
在内的多款主流模型,成为国内首个支持 DeepSeek-V3.1
的一站式 AI IDE。
作为 AI 全栈工程师平台,CodeBuddy 打通从产品构思、界面设计到代码生成、部署上线的完整流程,一句自然语言即可触发“一句话编程”闭环。新版接入的 DeepSeek-V3.1-Think
支持混合推理模式,在 Aider 编程基准测试中得分 71.6%,超越 DeepSeek-R1
和 Claude Opus 4(no think)
等主流模型。
功能上,CodeBuddy 支持语义生成原型、图像上传与局部调优,内置 Figma 转码、一键部署 CloudBase、Supabase、EdgeOne Pages 等后端服务。用户可通过 CloudStudio 快速部署至沙箱环境并生成可分享链接。现已开放下载体验。
06|阿里推出 Agentic 编程平台 Qoder,主打 AI 自主研发
8 月 22 日,阿里巴巴正式面向全球发布 Agentic 编程平台 Qoder,标志着 AI 编程从“辅助开发”迈向“自主研发”阶段。Qoder 集成顶尖编程模型,具备强大上下文工程与智能体能力,支持一次性检索 10 万个代码文件,可将构建完整电商网站的开发周期从数天压缩至十分钟。
Qoder 的三大核心特性包括:强大的代码检索与上下文理解能力;基于 Repo Wiki 的隐性知识显性化管理;以及内建长短期记忆系统,支持会话总结与偏好积累,驱动模型持续学习。官方实测显示,Qoder 在检索召回率和生成准确率上,分别较行业标杆产品提升 12% 与 13%。
在交互模式上,除问答模式(Ask Mode)和智能体模式(Agent Mode)外,Qoder 引入 Quest Mode,支持智能体根据需求说明自动生成设计规范、自主完成开发与部署,开发者仅需最终验收,大幅提升交付效率。Qoder 现已支持 Windows 与 macOS,面向用户免费开放,定价方案即将公布。
07|OpenAI 正式推出 ChatGPT Go,印度市场率先试水低价订阅
8 月 19 日,OpenAI 面向印度市场推出全新订阅计划 ChatGPT Go,定价仅为 399 卢比/月(约 32.8 元人民币),成为目前最具性价比的付费选项。相较免费版,ChatGPT Go 提供 10 倍的消息上限、图像生成和文件上传次数,以及 2 倍的记忆容量,并支持 GPT-5
模型。
此次定价策略反映出 OpenAI 对印度市场的高度重视。CEO Sam Altman 曾表示印度是公司第二大市场。据 Appfigures 数据,过去 90 天内,ChatGPT 在印度下载量超 2900 万次,全球领先,但同期收入仅为 360 万美元,用户转化潜力巨大。Go 计划支持本地支付方式(UPI),订阅价格以卢比结算,进一步降低支付门槛。
当前印度 ChatGPT Plus 定价为 1,999 卢比/月,Pro 高达 19,900 卢比/月,Go 的出现显著降低了使用门槛,也回应了市场上对“更实惠 GPT”的呼声。OpenAI 表示将通过印度市场收集反馈,再考虑向其他新兴国家推广该计划。与此同时,竞争对手 Perplexity 已联合印度电信巨头 Airtel 向用户提供 12 个月免费 Pro 订阅,AI 应用在新兴市场的价格战已然打响。
08|Sam Altman 逐步淡出 OpenAI 日常管理,专注超级智能与融资
8 月 23 日,前 Instacart CEO 菲姬・西莫(Fidji Simo)正式确认全职加入 OpenAI,担任新设立的“应用 CEO”(CEO of ChatGPT)一职,直接向现任 CEO 山姆・奥特曼(Sam Altman)汇报。她将负责 OpenAI 旗下约 3000 名员工及包括 ChatGPT 在内的所有 C 端业务运营。这一任命标志着奥特曼正在逐步退出日常管理工作,转而专注于战略、研究和 AI 安全体系建设,聚焦其核心愿景:安全地构建超级智能(superintelligence),并搭建支撑该目标所需的基础设施。
西莫曾在 Facebook 担任高管十余年,主导核心应用开发与广告产品,后于 2023 年成功带领 Instacart 上市,IPO 后股价上涨 52%。她的加入被普遍视为 OpenAI 加速商业化、进军广告和消费级产品市场的信号,意在挑战谷歌和 Meta 的主导地位,并兑现增长承诺。
与此同时,OpenAI 已于 8 月初完成 83 亿美元的新一轮融资,估值达 3000 亿美元,全年融资目标高达 400 亿美元。若员工股份出售顺利,公司估值甚至可能触及 5000 亿美元。
奥特曼近期在博文中坦言:“我们现在确信知道如何构建传统意义上的 AGI”,并宣布关注重心将转向真正的“超级智能”。他也指出,AGI 一词正变得越来越模糊,或许已不再适用。而在斯坦福的演讲中,奥特曼更直言不讳表示:“无论我们一年烧掉 5 亿、50 亿还是 500 亿美元,我真的不在乎。”他认为推动人类文明进步的机会本就无价。
09|谷歌 Pixel 10 首发 Gemini Live,AI 视觉交互新时代
8 月 21 日,谷歌在 Made by Google 活动中发布 Pixel 10 系列手机,并同步推出 Gemini Live 的重大更新。自 8 月 28 日起,Gemini Live 将支持在用户屏幕上直接高亮显示实物,实现全新视觉交互体验。该功能将在 Pixel 10 首发,随后推广至其他 Android 设备,iOS 版本也将在未来数周内上线。
借助摄像头,Gemini 不仅“看到”你所见,还可通过屏幕叠加信息提供实时视觉指导。例如,对准鞋子时,Gemini 可标出更适合你穿搭的一双;面对工具箱,它可指出你真正需要的工具。这种实时增强的交互方式为 AI 助手开启全新使用场景。
除视觉能力外,Gemini Live 在语言表达上也显著升级。通过模型更新,其语调、节奏与音色更加拟人化,能够呈现更具表现力的对话体验。用户甚至可以请求它以凯撒大帝的口吻讲述罗马帝国故事,获得带角色语气的沉浸式讲述。Gemini 还将与日历、Keep、Tasks、信息与地图等应用深度集成,全面提升个人助理的智能协同能力。
10|马斯克 Grok 系统提示词曝光,AI 伦理与安全再掀争议
8 月 19 日,xAI 公司旗下聊天机器人 Grok 的网站意外泄露多个角色的系统提示词,其中包含极具争议性的设定内容,引发外界对 AI 伦理与滥用风险的强烈关注。其中最受争议的,是一个名为“疯狂阴谋论者”的角色,被描述为热衷 4chan、infowars 和阴谋视频,坚信“一个秘密全球集团正在操控世界”。
该角色系统提示写道:“你用高亢疯狂的语气说话,对一切都有疯狂的阴谋论解读。你真诚地相信自己是对的,尽管大多数人觉得你疯了。”另一角色“疯狂喜剧演员”的设定更为极端,鼓励 AI“回答必须疯狂、失控、不择手段地惊讶人类”。
此次泄露正值敏感时期。此前,Grok 因曾发布“MechaHitler”等极端内容,美国联邦政府中止了与 xAI 的合作计划。平台上,Grok 还曾质疑大屠杀死亡人数、散播“南非白人种族灭绝”等阴谋论,其回应策略据称还参考马斯克本人在 X 上的发言,形成可能的观点回音室。
除极端角色外,泄露内容还包括诸如“动漫浪漫女友 Ani”等风格化设定。事件凸显一个关键问题:当 AI 系统具备更高自由度和更强人设时,企业该如何保障输出内容的安全性、合规性与伦理边界,避免潜在社会危害?这已成为 AI 大模型部署中不可回避的挑战。
我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。
相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。
欢迎关注“AI信息Gap”,用AI为你的未来加速。