DeepSeek R2的发布,再一次被推迟了。
据《The Information》援引知情人士的消息,DeepSeek 内部原计划在今年 5 月份正式发布下一代大模型 DeepSeek-R2,但由于目前模型的整体表现尚未达到公司 CEO 梁文峰的预期标准,发布计划被暂时搁置。
《The Information》报道称,尽管工程团队已经数月内不断调优 R2,但CEO梁文峰在近期评估后认为效果未达标,因此未批准模型发布,也未设定新的目标日期。
DeepSeek-R2 被寄予厚望。
早在2025年初,其研发路线就明确指向更强的多语言推理能力和编码生成能力。在 R1 模型获得业内较高评价后,R2 被视为关键升级版本。
这一推迟并非完全出人意料。
首先,技术标准本身就设定得很高,DeepSeek 在 R1 模型中已经展现出“以低成本构建高性能推理模型”的能力,因此对下一代模型提出更高标准本属自然。
其次,更关键的是芯片供应的问题。
《The Information》指出,DeepSeek 正面临与其他中国 AI 企业类似的挑战,即高端 AI 训练芯片短缺。
特别是 2024 年 4 月以来,美国进一步收紧了对华先进芯片出口管制,英伟达的H20 GPU停止供货,导致训练与部署算力紧张,严重影响了模型迭代速度。
这一现状在市场层面也有所体现。
据悉, DeepSeek 已经开始与多家中国云服务提供商沟通 R2 模型的部署事宜,但这些合作方普遍反馈,现阶段他们还主要部署的是 R1 模型,算力环境也主要基于 H20 GPU。
R2 何时上线,仍要取决于模型本身的优化完成度以及硬件资源是否到位。
根据彭博社、路透社和 The Information 的综合报道,DeepSeek 的技术路径和发布策略,代表了一类中国 AI 企业的典型特征:对标 OpenAI,强调多模态、强代码、成本效能比,在研发上追求精益求精,在发布上审慎推进。
-END-
您也可以关注我们的官方微信公众号(ID:ctoutiao),给您更多好看的内容。