日前,据《The Information》报道,阿里巴巴与百度已开始使用自主研发的AI芯片训练模型,以部分替代英伟达芯片。
阿里云在2023年披露自研AI芯片计划。“zhenwu ”定位为云端AI训练与推理加速器,强调高带宽内存(HBM)与能效比平衡。
The Information称,2025年初起,使用“zhenwu处理单元”训练小型AI模型,而未进入超大规模主力任务,说明量产与生态适配仍在探索期。
百度自2018年推出昆仑系列,P800是新一代产品,采用自研XPU架构,在FP16/INT8推理场景下具备较强性价比。
《The Information》报道,百度P800已进入Ernie训练实验阶段,但是否能承担大规模分布式训练仍需验证。
百度方面表示,昆仑芯片已在多个内部业务中部署,目标是构建自主AI算力底座。
这一变化的背后,是美国对中国高性能AI芯片出口的限制不断升级,以及“国产替代”的不断推进。
《The Information》此前还报道,DeepSeek已使用华为昇腾AI芯片,训练其部分模型。
另有报道指出,DeepSeek遇到训练稳定性、多卡互联带宽不足等问题,导致模型发布时间推迟。
但 DeepSeek 正不断在推进与国产 AI 芯片的适配进度。
日前, DeepSeek 微信公众号推送的一句留言称,“UE8M0 FP8 是针对即将发布的下一代国产芯片设计”。
相关阅读:国产GPU芯片 DeepSeek 时刻:单日1.7 万亿市值狂飙背后
中信建投有报告指出,DeepSeek表示新精度格式针对即将发布的下一代国产芯片设计,表明未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。
种种迹象表明,国产 AI 芯片正走出实验室,尽可能的应用到大模型场景中,尤其在“中小规模”和推理部署方面已经具备一定竞争力,比如成本可控、接入更友好等。
相关阅读: H20解禁即退场,华为昇腾910B已达H20同等性能
但在超大规模训练方面,短期内仍难与英伟达生态脱钩。
这种“混合使用、分场景部署”的状态,短期内应该是主流。
这既是妥协,也是务实。
2020 年《国家十四五规划》明确提出,到 2025 年国产芯片自给率要达到 70%,为产业发展指明方向、注入动力。