DeepSeek V3 - 0324 在人工智能分析指数中成为得分最高的非推理模型,这是开源人工智能发展历程中的一个标志性成果。
在这项基准测试中,这款新模型的得分提升了 7 分,超越了谷歌的 Gemini 2.0 Pro、Anthropic 的 Claude 3.7 Sonnet 以及 Meta 的 Llama 3.3 70B 等专有模型。
虽然 V3 - 0324 在推理能力上落后于包括 DeepSeek 自己的 R1 以及 OpenAI 和阿里巴巴推出的推理模型,但这一成果凸显了开源解决方案在对延迟敏感的应用场景中的可行性日益增强,在这些场景中,即时响应至关重要。
DeepSeek V3 - 0324 开启开源人工智能新时代
非推理模型在生成答案时无需经过深思熟虑的 “思考” 阶段,能立即给出回应,对于聊天机器人、客户服务自动化和实时翻译等实时应用场景来说至关重要。DeepSeek 的这一最新版本为这些应用树立了新的标准,甚至超越了领先的专有工具。
开源权重模型与专有(非推理)模型的人工智能分析指数
人工智能分析指数涵盖了推理、知识、数学与编码等 7 个方面的评估(独立评估即将推出)。
“这是开源权重模型首次成为领先的非推理模型,是开源领域的一个里程碑。” 人工智能分析机构表示。尽管在需要复杂问题解决能力的任务中,专有推理模型仍更胜一筹,但该模型的表现使其与专有推理模型的差距进一步缩小。
DeepSeek V3 - 0324 保留了 2024 年 12 月版本的大部分规格,具体如下:
上下文窗口为 128k(通过 DeepSeek 的 API 限制为 64k)
总参数达 6710 亿个,以 FP8 精度运行需要超过 700GB 的 GPU 内存
370 亿个活跃参数
仅支持文本功能(不支持多模态)
采用 MIT 许可证
“这可不是你在家就能运行的模型!” 人工智能分析机构打趣道,强调了其对企业级基础设施的要求。
开源人工智能来势汹汹
虽然像 DeepSeek R1 这样的专有推理模型在更广泛的人工智能指数中仍占据主导地位,但差距正在逐渐缩小。
三个月前,DeepSeek V3 几乎与 Anthropic 和谷歌的专有模型相当,但未能实现超越。如今,更新后的 V3 - 0324 不仅在开源模型中独占鳌头,还击败了所有专有的非推理竞争对手。
“这次发布的成果甚至比 R1 还要令人印象深刻。” 人工智能分析机构评价道。
DeepSeek 的进步标志着人工智能领域的一个转变,开源框架在该领域正逐渐与封闭系统展开竞争。对于开发者和企业而言,获得 MIT 许可的 V3 - 0324 是一个功能强大且适应性强的工具,尽管其计算成本可能会限制其普及程度。
“DeepSeek 如今正在引领非推理开源权重模型的前沿发展。” 人工智能分析机构宣称。
随着 R2 即将问世,业界正期待着人工智能性能的又一次潜在飞跃。