DeepSeek系列模型覆盖了自然语言处理、计算机视觉、多模态等多个领域,并在不同参数规模和功能场景下进行了细分。以下是主要模型系列的总结:
1. 自然语言处理(NLP)模型
-
DeepSeek-R1系列
包括满血版R1(671B参数)和多个轻量化蒸馏版本(如1.5B、7B、14B、32B、70B参数),专注于推理任务,性能对标OpenAI的o1模型,具备高效的数学、代码和语言推理能力-
示例:R1-Distill-Qwen-32B、R1-Distill-Llama-8B等。
-
-
DeepSeek-V系列
-
DeepSeek-V3:基于MoE(混合专家系统)架构,参数达671B,激活参数37B,性能对标GPT-4o和Claude-3.5-Sonnet,支持长文本理解和复杂任务
-
DeepSeek-V2:高性价比模型,适合企业级大规模部署
-