5月20日,在2026阿里云峰会上,阿里发布基于平头哥新一代AI芯片真武M890的128卡超节点服务器,搭载互联芯片ICN Switch 1.0,通信时延低至百纳秒级,可让128张AI芯片组成一台计算机,满足海量Agent并发推理和大模型训练需求。这是面向Agentic时代全面升级的重要部分,当天阿里云推出了全新“芯-云-模型-推理”技术体系。

Agentic时代,算力集群需要承载成千上万个Agent同时运行,每个Agent在一次任务中可能连续发起数十次模型调用,这对通信时延和带宽有极高要求。磐久AL128超节点服务器基于自研AI芯片和互联芯片打造,通过单机柜128卡紧密耦合互联,P2P时延低于150ns,单柜带宽达到Pb/s级,可支海量Agent的并发请求。该超节点服务器已上线阿里云百炼,支持Qwen、DeepSeek、Kimi等主流模型。

据介绍,首次亮相的真武M890采用自研并行计算架构,内置144GB显存,性能是真武810E的3倍,片间互联带宽达到800GB/s,芯片原生支持FP32到FP4等多种数据精度,可应用于高精度训练、低精度和超低精度推理的全场景,低精度推理场景下,不仅可以保证模型输出质量,还能显著降低单次推理的算力开销。
平头哥互联芯片ICN Switch 1.0支持自研ICN互联总线协议和PCCL通信库,吞吐量达25.6Tbps,可支持真武M890的高效互联,提升AI集群的算力效率。真武M890搭配ICN Switch1.0芯片,可实现64卡全带宽互联,显著提升大规模智算集群计算的效率与稳定性。基于平头哥自研T-Head SAIL软件栈的软硬协同,可最大程度释放芯片的算力。
大会现场,平头哥首次公布真武系列芯片的规划,未来两年将陆续推出算力更强的真武V900、真武J900两代芯片,以满足Agentic时代千行百业的AI算力需求。目前,真武系列芯片已累计出货56万片,服务了中国电信、中国一汽、浦发银行等20多个行业的400多家客户。

随着Agent应用的爆发,AI的核心任务逐渐从纯对话转向任务执行,这不仅需要高AI算力支撑,其任务规划、状态管理、工具调用等环节极其依赖CPU,CPU成为影响Agent执行效率的关键部件。平头哥拥有自研的服务器CPU倚天系列,可与真武AI芯片高效协同,大幅提升AI推理效率,有效应对Agent高并发任务的负载压力。
目前,平头哥已推出真武系列AI芯片、倚天系列Arm服务器CPU、磐脉系列智能网卡、镇岳系列存储主控芯片、ICN Switch互联芯片等数据中心核心芯片,实现算力、网力和存力的全栈自研。








