2025国内AI模型排行：API价格对比

2025年中国AI大模型十强集中展现了国内人工智能领域的最高水平，这些模型在自然语言处理、计算机视觉等核心场景中表现卓越。为帮助用户高效选型，本报告从产品特性、技术架构、成本效益及性能指标（如推理速度、准确率、算力需求等）多维度展开深度对比分析，通过详实的基准测试数据和商业化案例解读，为您提供全面的决策支持。

国内10大AI大模型介绍

DeepSeek V3

DeepSeek-V3是由深度求索（DeepSeek）公司开发的一款先进的开源大语言模型，采用混合专家（MoE）架构，拥有 671B 总参数，其中每 token 激活 37B 参数。模型在 14.8 万亿高质量 token 上进行预训练，并通过监督微调和强化学习进一步优化。

moonshot-v1-32k

Moonshot-v1-32k是Moonshot AI推出的一款千亿参数的语言模型，支持32K上下文窗口，特别适合长文本的理解和内容生成场景。它具备优秀的语义理解、指令遵循和文本生成能力，能够根据用户输入生成相应的文本输出，广泛应用于内容创作、代码生成、文本摘要等领域。

通义千问-Max

通义千问-Max，即Qwen2.5-Max，是阿里云通义千问旗舰版模型，于2025年1月29日正式发布。该模型预训练数据超过20万亿tokens，在多项公开主流模型评测基准上录得高分，位列全球第七名，是非推理类的中国大模型冠军。它展现出极强劲的综合性能，特别是在数学和编程等单项能力上排名第一。

Doubao 1.5 pro 256k

Doubao 1.5 pro 256k 是字节跳动推出的豆包大模型的升级版本，基于稀疏 MoE 架构，性能杠杆达 7 倍，仅用稠密模型七分之一的参数量就超越了 Llama-3.1-405B 等大模型的性能。它支持 256k 上下文窗口的推理，输出长度最大支持 12k tokens，在推理和创作任务中表现出色。该模型在多模态任务上也有显著提升，视觉推理和文档识别能力增强，可处理复杂场景下的图像和文档，为用户提供更自然、更丰富的交互体验。此外，Doubao 1.5 pro 256k 在知识、代码、推理、中文等多个测评基准上表现优于 GPT-4o 和 Claude 3.5 Sonnet。

ERNIE 4.0

ERNIE 4.0 是一款具有强大自然语言处理能力的大型语言模型。它采用多任务学习框架，能够同时处理多种自然语言处理任务，如文本分类、情感分析、问答系统等。此外，ERNIE 4.0 还通过引入知识图谱，增强了模型对知识的理解能力，提高了在特定领域的性能。它还支持多种语言，具有较好的跨语言能力，可以处理不同语言的自然语言处理任务。在设计时，ERNIE 4.0 注重模型的可解释性，通过可视化等手段，帮助用户更好地理解模型的决策过程。这些特点使得 ERNIE 4.0 在自然语言处理领域具有广泛的应用场景和显著的性能优势。

hunyuan lite

Hunyuan Lite 是腾讯混元大模型的轻量级版本，于2024年10月30日推出。它采用混合专家模型（MoE）结构，支持250K的上下文窗口，最大输入为250k Token，最大输出为6k Token。在中文NLP、英文NLP、代码、数学等多项评测集上表现优异，领先众多开源模型。Hunyuan Lite 适用于对效果、推理性能、成本控制相对平衡的需求场景，能够满足绝大部分用户的日常使用需求。

Spark Pro

Spark Pro-128K是科大讯飞星火推出的大语言模型，具备128亿参数规模，专为处理超长文本场景设计。该模型支持128K tokens的超长上下文窗口，显著提升了金融、医疗、科研等领域的长文档理解和生成能力。

Baichuan4 Turbo

Baichuan4 Turbo是百川智能推出的一款高效、低成本的大模型。它在文本生成、知识问答、多语言处理等核心能力上相比Baichuan 4有显著提升。Baichuan4 Turbo只需2卡4090的算力即可完成部署，推理成本仅为Baichuan4的15%，在GPT—4o同档位效果的模型中部署成本最低，非常适合企业探索复杂场景。此外，它在金融、教育、医疗等场景下的专业细分任务平均可用率高达96%，位居行业首位。

GLM-4-Plus

GLM-4-Plus是智谱AI推出的新一代基座大模型，在语言理解、多模态交互和推理能力上实现突破。其语言文本能力与国际顶尖模型GPT-4o相当，支持128K长上下文处理，能精准总结复杂文档；多模态方面，搭配GLM-4V-Plus可解析图像/视频内容并实现时序问答。模型通过PPO算法强化逻辑推理，解决数学、代码等复杂问题。在SuperCLUE等权威测评中位列全球前三，打破国外模型垄断。应用场景覆盖智能客服、代码辅助、财务分析等，实测效率提升高达300%。

Step-2-mini

Step-2-mini是基于新一代自研Attention架构MFA的极速大模型，用极低成本达到和step1类似的效果，同时保持了更高的吞吐和更快响应时延。能够处理通用任务，在代码能力上具备特长，上下文长度为32k。

想了解比较报告的深度内容，点此查看完整报告

国内10个AI大模型API价格对比

API模型名称	免费试用额度	输入价格（缓存命中）	输入价格（缓存未命中）	输出价格
DeepSeek V3	500万tokens	￥0.5/百万token (￥5/1M Tokens)	￥2/百万token (￥20/1M Tokens)	￥8/百万token (￥80/1M Tokens)
moonshot-v1-32k	赠送100万tokens 有效期：180天	￥5.00/1M tokens	￥5.00/1M tokens	￥20.00/1M tokens
通义千问-Max	赠送100万Token额度有效期：百炼开通后180天内	￥0.0024/千token (￥2.40/1M Tokens)	￥0.0024/千token (￥2.40/1M Tokens)	￥0.0096/千token (￥9.60/1M Tokens)
Doubao 1.5 pro 256k	50万tokens	￥5.00/百万tokens	￥5.00/百万tokens	￥9.00/百万tokens
ERNIE 4.0	N/A	￥0.004/千tokens (￥4/1M Tokens)	￥0.004/千tokens (￥4/1M Tokens)	￥0.016/千tokens (￥16/1M Tokens)
hunyuan lite	10,000 tokens 免费额度（有效期30天）	￥0.005/千tokens (￥5/1M Tokens)	￥0.005/千tokens (￥5/1M Tokens)	￥0.015/千tokens (￥15/1M Tokens)
Spark Pro	个人注册并认证赠送500万tokens，一年有效期。	￥0.05~0.07/万 Tokens	￥0.05~0.07/万 Tokens	￥0.05~0.07/万 Tokens
Baichuan4 Turbo	新注册用户免费赠送金80 元	￥0.015/千tokens (￥15/1M Tokens)	￥0.015/千tokens (￥15/1M Tokens)	￥0.015/千tokens (￥15/1M Tokens)
GLM-4-Plus	新用户注册可获 1 亿 tokens	￥0.05/千tokens (￥50/1M Tokens)	￥0.05/千tokens (￥50/1M Tokens)	￥0.05/千tokens (￥50/1M Tokens)
Step-2-mini	N/A	￥1/1M tokens	￥1/1M tokens	￥2/1M tokens

想了解比较报告的深度内容，点此查看完整报告

根据表格数据，以下是对各模型在价格维度上的总结：

DeepSeek V3
- 价格: 输入 ¥0.5/百万tokens，输出 ¥2/百万tokens，缓存 ¥8/百万tokens。
- 评价: 输入价格极低，输出价格适中，缓存价格较高。适合需要大量输入但输出较少的场景，性价比高。
moonshot-v1-32k
- 价格: 输入/输出均为 ¥5/百万tokens，缓存 ¥20/百万tokens。
- 评价: 输入输出价格中等偏高，缓存价格昂贵。适合对性能要求高但预算有限的场景，整体性价比一般。
通义千问-Max
- 价格: 输入 ¥0.0024/token（约 ¥2.4/百万tokens），输出 ¥0.0096/token（约 ¥9.6/百万tokens）。
- 评价: 输入价格低廉，输出价格较高，无缓存价格。适合输入密集型任务，但输出成本需谨慎考虑。
Doubao 1.5 pro 256k
- 价格: 输入/输出均为 ¥5/百万tokens，缓存 ¥9/百万tokens。
- 评价: 输入输出价格中等，缓存价格相对合理。综合成本适中，适合均衡型任务。
ERNIE 4.0
- 价格: 输入/输出 ¥0.004/token（约 ¥4/百万tokens），缓存 ¥0.016/token（约 ¥16/百万tokens）。
- 评价: 输入输出价格偏高，缓存价格较高。整体成本较高，适合对性能要求极高的场景。
hunyuan lite
- 价格: 输入 ¥0.005/token（约 ¥5/百万tokens），输出 ¥0.015/token（约 ¥15/百万tokens）。
- 评价: 输入价格中等，输出价格偏高，无缓存价格。适合输入为主的任务，但输出成本较高。
Spark Pro
- 价格: 输入/输出 ¥0.05-0.07/万tokens（约 ¥5-7/百万tokens）。
- 评价: 价格区间灵活，整体偏中低，适合预算有限且对性能要求适中的场景，性价比不错。
Baichuan4 Turbo
- 价格: 输入/输出均为 ¥0.015/千tokens（约 ¥15/百万tokens），缓存同价。
- 评价: 价格偏高，输入输出缓存成本一致。适合对性能要求较高但预算充足的场景。
GLM-4 Plus
- 价格: 输入/输出均为 ¥0.05/千tokens（约 ¥50/百万tokens），缓存同价。
- 评价: 价格极高，适合对性能要求极高且预算充足的场景，性价比低。
Step-2-mini
- 价格: 输入 ¥1/百万tokens，输出 ¥2/百万tokens。
- 评价: 输入价格极低，输出价格低廉，无缓存价格。适合低预算、高输入输出的轻量级任务，性价比极高。