DeepSeek-V3.1 混合推理发布，智谱 AutoGLM 2.0 云端登场，ChatGPT Go 印度上线！| AI Weekly 8.18-8.24

AI信息Gap

于 2025-08-24 06:00:00 发布

阅读量456

点赞数 9

CC 4.0 BY-SA版权

文章标签：人工智能 chatgpt 开源 gpt

本文链接：https://blog.csdn.net/weixin_40774379/article/details/150653726

又是属于国产 AI 的一周！

📢本周AI快讯 | 1分钟速览🚀

1️⃣ 🎯 DeepSeek-V3.1 正式发布 ：开启 AI Agent 新篇章，支持“思考”与“非思考”双模式，deepseek-chat 和 deepseek-reasoner API 同步上线，128K 上下文支持。

2️⃣ 🇨🇳 DeepSeek 适配国产芯片 ：首次公开 UE8M0 FP8 精度格式，专为国产下一代 AI 芯片设计，节省 50%-75% 显存，加速软硬一体化突破。

3️⃣ ☁️ 智谱 AutoGLM 2.0 发布 ：全球首个云端手机 Agent，AI 获得“专属手机”在云端独立执行任务，已支持 40+ 常用 App 远程操作。

4️⃣ ⚡ Kimi K2 Turbo 大提速 ：输出速度飙升至 100 Tokens/s，基于 MoE 架构的 kimi-k2-turbo-preview 生成效率提升 40%，5 折优惠持续至 9 月 1 日。

5️⃣ 💻 腾讯 CodeBuddy 公测 ：国内首个支持 DeepSeek-V3.1-Think 的 AI IDE，集成多款主流模型，实现“一句话编程”全流程闭环。

6️⃣ 🔧 阿里发布 Qoder 平台 ：Agentic 编程新范式，一次检索 10 万个代码文件，将电商网站开发从数天压缩至十分钟，引入 Quest Mode 自主开发。

7️⃣ 💰 ChatGPT Go 印度上线 ：OpenAI 推出 399 卢比/月（约 32.8 元）低价订阅，提供 10 倍消息上限，支持 GPT-5 模型，瞄准新兴市场。

8️⃣ 🚀 Sam Altman 转型战略 ：Fidji Simo 任 ChatGPT CEO 负责日常运营，Altman 专注超级智能研发，OpenAI 完成 83 亿美元融资，估值达 3000 亿。

9️⃣ 👁️ Gemini Live 视觉升级 ：谷歌 Pixel 10 首发实时视觉交互，AI 可在屏幕上高亮标注实物，与日历、地图等应用深度集成。

🔟 ⚠️ Grok 提示词泄露 ：xAI 意外曝光“疯狂阴谋论者”等争议角色设定，引发 AI 伦理边界讨论，凸显大模型安全挑战。

01｜DeepSeek-V3.1 正式发布，开启 AI Agent 新篇章

8 月 21 日，DeepSeek 正式发布新一代大模型 DeepSeek-V3.1，作为继 DeepSeek-V3 和 DeepSeek-R1 后的重要迭代，该版本标志着 DeepSeek 正式迈入 AI Agent 时代。V3.1 为混合模型，支持“思考”与“非思考”两种模式，具备更强泛化能力与多场景适配性。

此次升级重点体现在三方面：一是引入混合推理架构，用户可通过“深度思考”按钮自由切换推理模式；二是显著提升思考效率，V3.1-Think 在输出 token 减少 20%-50% 的同时，整体任务表现仍与 R1-0528 持平；三是通过后训练优化增强 Agent 能力，在工具调用和任务执行方面表现更稳健。

在 SWE 修复测试、终端操作任务（Terminal-Bench）、复杂搜索（browsecomp）及跨学科难题（HLE）中，DeepSeek-V3.1 较 R1 系列取得全面性能提升。API 层面也同步升级：非思考模式对应 deepseek-chat，思考模式对应 deepseek-reasoner，支持最长 128K 上下文，并引入 strict Function Calling 确保输出结构合规。此外，API 已兼容 Anthropic 格式，方便集成至 Claude Code 体系。

02｜DeepSeek 预告国产芯片适配，UE8M0 FP8 精度引发关注

8 月 21 日，DeepSeek 发布新一代大模型 DeepSeek-V3.1，并首次公开其采用 UE8M0 FP8 Scale 参数精度格式。更引人注目的是，DeepSeek 官方在社交平台留言确认：UE8M0 FP8 是专为即将发布的国产下一代 AI 芯片设计，引发行业热议。

UE8M0 FP8 是一种创新的低精度数值格式，其中 UE 表示无符号 8 位指数（E8M0），配合独立缩放机制，在保持计算稳定性的同时，大幅降低显存占用。相较传统 FP16/FP32，FP8 能节省 50%–75% 显存，在 NVIDIA H800 GPU 上矩阵运算速度快 2–3 倍。UE8M0 精度格式设计中，每 32 个 FP8 数据仅需附加 8bit 缩放信息，远低于传统 FP32 的 4 字节开销。

多家国产芯片厂商已布局 FP8 原生支持，包括摩尔线程（MUSA 3.1 GPU）、芯原（VIP9000 NPU）等，计划于 2025 年下半年首发产品，并与 DeepSeek、华为等 15 家企业完成联合验证。摩尔线程作为首个支持原生 FP8 的国产 GPU 厂商，构建了完整的 MUSA 3.1 架构，并获得和而泰 1.244% 股权投资。

分析认为，DeepSeek 借助 UE8M0 主动对齐国产硬件的性能特征，正加速构建“国产芯片—国产模型—国产应用”闭环生态，助推 AI 自主技术实现软硬一体化突破。

03｜智谱发布 AutoGLM 2.0，全球首个云端手机 Agent 登场

8 月 20 日，智谱发布 AutoGLM 2.0，作为全球首个 Phone-Use AI Agent 的重磅升级版本，首次实现“Agent + 云手机/云电脑”新范式。该架构使 AI 智能体可在云端独立完成任务，无需占用用户本地设备资源，为 AI Agent 技术带来结构性变革。

核心创新在于云执行模式：AI 被分配“专属手机或电脑”，在不干扰用户正常使用的前提下，可后台完成任务。当前 AutoGLM 已支持远程操作抖音、小红书、美团、京东等 40+ 常用 App。智谱 CEO 张鹏表示，未来个人竞争力将是“自身能力 + N 个 AI 智能体”的总和。

技术上，AutoGLM 由最新语言模型 GLM-4.5 与多模态模型 GLM-4.5V 驱动，并采用端到端在线强化学习路线，提升在真实环境中的任务执行力。在 Device Use 测试中，其表现优于 ChatGPT Agent、UI-TARS-1.5 与 Claude Sonnet 4，展现出更强的鲁棒性与泛化能力。

AutoGLM 的控制能力已封装为 API，开发者可将其嵌入各类设备，从 AI 眼镜到智能家居均可接入。移动端 API 与生态共建计划现已开放，后续还将推出“定时任务”功能，实现 AI 智能体主动规划与执行，例如每天 9 点自动整理未读邮件并推送摘要至微信，推动 Agent 从响应式向主动型演进。

04｜Kimi K2 Turbo 提速至 100 Tokens/s，长文生成效率飙升

8 月 22 日，月之暗面宣布其高速模型 kimi-k2-turbo-preview 再度实现重大突破：输出速度由此前的 60 Tokens/s 提升至峰值 100 Tokens/s，创下该系列新高。这一成果得益于团队在系统调优与底层工程上的持续优化。

早在 8 月 1 日发布初版高速版 Kimi K2 时，模型输出速度便已从每秒 10 Tokens 提升至 40 Tokens，实现了 4 倍跃升。Kimi K2 基于混合专家（MoE）架构打造，具备 1 万亿总参数与 320 亿激活参数，在前沿知识、数学、编码等任务中展现出非思考类模型中的 SOTA 表现。

定价方面，Kimi K2 Turbo 目前仍享受 5 折优惠，具体价格如下：输入（缓存命中）2 元/百万 tokens，输入（未命中）8 元，输出为 32 元，优惠期持续至 9 月 1 日。实测结果显示，该模型生成一篇 2000 字的技术分析文章仅需 2 分钟，生成效率较旧版本提升约 40%，显著加速了长文本撰写与代码生成等复杂任务流程。

05｜腾讯 CodeBuddy 开放公测，首发接入 DeepSeek-V3.1

8 月 22 日，腾讯云正式开放 CodeBuddy IDE 国内版公测，用户现可无邀请码免费体验这一集成多模型的 AI 编程平台。新版支持包括 DeepSeek-V3.1-Think、DeepSeek-V3-0324、DeepSeek-R1-0528 及 hunyuan-turbos 在内的多款主流模型，成为国内首个支持 DeepSeek-V3.1 的一站式 AI IDE。

作为 AI 全栈工程师平台，CodeBuddy 打通从产品构思、界面设计到代码生成、部署上线的完整流程，一句自然语言即可触发“一句话编程”闭环。新版接入的 DeepSeek-V3.1-Think 支持混合推理模式，在 Aider 编程基准测试中得分 71.6%，超越 DeepSeek-R1 和 Claude Opus 4（no think） 等主流模型。

功能上，CodeBuddy 支持语义生成原型、图像上传与局部调优，内置 Figma 转码、一键部署 CloudBase、Supabase、EdgeOne Pages 等后端服务。用户可通过 CloudStudio 快速部署至沙箱环境并生成可分享链接。现已开放下载体验。

06｜阿里推出 Agentic 编程平台 Qoder，主打 AI 自主研发

8 月 22 日，阿里巴巴正式面向全球发布 Agentic 编程平台 Qoder，标志着 AI 编程从“辅助开发”迈向“自主研发”阶段。Qoder 集成顶尖编程模型，具备强大上下文工程与智能体能力，支持一次性检索 10 万个代码文件，可将构建完整电商网站的开发周期从数天压缩至十分钟。

Qoder 的三大核心特性包括：强大的代码检索与上下文理解能力；基于 Repo Wiki 的隐性知识显性化管理；以及内建长短期记忆系统，支持会话总结与偏好积累，驱动模型持续学习。官方实测显示，Qoder 在检索召回率和生成准确率上，分别较行业标杆产品提升 12% 与 13%。

在交互模式上，除问答模式（Ask Mode）和智能体模式（Agent Mode）外，Qoder 引入 Quest Mode，支持智能体根据需求说明自动生成设计规范、自主完成开发与部署，开发者仅需最终验收，大幅提升交付效率。Qoder 现已支持 Windows 与 macOS，面向用户免费开放，定价方案即将公布。

07｜OpenAI 正式推出 ChatGPT Go，印度市场率先试水低价订阅

8 月 19 日，OpenAI 面向印度市场推出全新订阅计划 ChatGPT Go，定价仅为 399 卢比/月（约 32.8 元人民币），成为目前最具性价比的付费选项。相较免费版，ChatGPT Go 提供 10 倍的消息上限、图像生成和文件上传次数，以及 2 倍的记忆容量，并支持 GPT-5 模型。

此次定价策略反映出 OpenAI 对印度市场的高度重视。CEO Sam Altman 曾表示印度是公司第二大市场。据 Appfigures 数据，过去 90 天内，ChatGPT 在印度下载量超 2900 万次，全球领先，但同期收入仅为 360 万美元，用户转化潜力巨大。Go 计划支持本地支付方式（UPI），订阅价格以卢比结算，进一步降低支付门槛。

当前印度 ChatGPT Plus 定价为 1,999 卢比/月，Pro 高达 19,900 卢比/月，Go 的出现显著降低了使用门槛，也回应了市场上对“更实惠 GPT”的呼声。OpenAI 表示将通过印度市场收集反馈，再考虑向其他新兴国家推广该计划。与此同时，竞争对手 Perplexity 已联合印度电信巨头 Airtel 向用户提供 12 个月免费 Pro 订阅，AI 应用在新兴市场的价格战已然打响。

08｜Sam Altman 逐步淡出 OpenAI 日常管理，专注超级智能与融资

8 月 23 日，前 Instacart CEO 菲姬・西莫（Fidji Simo）正式确认全职加入 OpenAI，担任新设立的“应用 CEO”（CEO of ChatGPT）一职，直接向现任 CEO 山姆・奥特曼（Sam Altman）汇报。她将负责 OpenAI 旗下约 3000 名员工及包括 ChatGPT 在内的所有 C 端业务运营。这一任命标志着奥特曼正在逐步退出日常管理工作，转而专注于战略、研究和 AI 安全体系建设，聚焦其核心愿景：安全地构建超级智能（superintelligence），并搭建支撑该目标所需的基础设施。

西莫曾在 Facebook 担任高管十余年，主导核心应用开发与广告产品，后于 2023 年成功带领 Instacart 上市，IPO 后股价上涨 52%。她的加入被普遍视为 OpenAI 加速商业化、进军广告和消费级产品市场的信号，意在挑战谷歌和 Meta 的主导地位，并兑现增长承诺。

与此同时，OpenAI 已于 8 月初完成 83 亿美元的新一轮融资，估值达 3000 亿美元，全年融资目标高达 400 亿美元。若员工股份出售顺利，公司估值甚至可能触及 5000 亿美元。

奥特曼近期在博文中坦言：“我们现在确信知道如何构建传统意义上的 AGI”，并宣布关注重心将转向真正的“超级智能”。他也指出，AGI 一词正变得越来越模糊，或许已不再适用。而在斯坦福的演讲中，奥特曼更直言不讳表示：“无论我们一年烧掉 5 亿、50 亿还是 500 亿美元，我真的不在乎。”他认为推动人类文明进步的机会本就无价。

09｜谷歌 Pixel 10 首发 Gemini Live，AI 视觉交互新时代

8 月 21 日，谷歌在 Made by Google 活动中发布 Pixel 10 系列手机，并同步推出 Gemini Live 的重大更新。自 8 月 28 日起，Gemini Live 将支持在用户屏幕上直接高亮显示实物，实现全新视觉交互体验。该功能将在 Pixel 10 首发，随后推广至其他 Android 设备，iOS 版本也将在未来数周内上线。

借助摄像头，Gemini 不仅“看到”你所见，还可通过屏幕叠加信息提供实时视觉指导。例如，对准鞋子时，Gemini 可标出更适合你穿搭的一双；面对工具箱，它可指出你真正需要的工具。这种实时增强的交互方式为 AI 助手开启全新使用场景。

除视觉能力外，Gemini Live 在语言表达上也显著升级。通过模型更新，其语调、节奏与音色更加拟人化，能够呈现更具表现力的对话体验。用户甚至可以请求它以凯撒大帝的口吻讲述罗马帝国故事，获得带角色语气的沉浸式讲述。Gemini 还将与日历、Keep、Tasks、信息与地图等应用深度集成，全面提升个人助理的智能协同能力。

10｜马斯克 Grok 系统提示词曝光，AI 伦理与安全再掀争议

8 月 19 日，xAI 公司旗下聊天机器人 Grok 的网站意外泄露多个角色的系统提示词，其中包含极具争议性的设定内容，引发外界对 AI 伦理与滥用风险的强烈关注。其中最受争议的，是一个名为“疯狂阴谋论者”的角色，被描述为热衷 4chan、infowars 和阴谋视频，坚信“一个秘密全球集团正在操控世界”。