元脑HC1000超扩展AI服务器与DirectCom架构细节图

2025年12月25日

43

612

推理成本打穿1元/百万token,浪潮信息推动Agent规模化的“最后一公里”

浪潮信息近日推出名为元脑HC1000的超扩展AI服务器,宣称将大模型推理成本首次降至1元/每百万token。该产品以全对称DirectCom极速架构为核心,旨在通过体系级的设计优化打破当前智能体规模化落地的成本瓶颈。

元脑HC1000与DirectCom架构

元脑HC1000采用无损超扩展设计,每计算模组配置16颗AIPU,使用直达通信实现超低延迟,并以计算与通信1:1均衡配比保障全局无阻塞通信。该架构支持按需配置计算实例,最大化资源利用率,从而显著提升推理吞吐与性价比。

成本下降的行业意义

推理成本下降至1元/百万token被视为打通智能体‘最后一公里’的关键一步。随着智能体对超长上下文、多步规划等复杂任务的需求激增,token消耗呈指数级增长,降低单token成本对商业化与普惠化具有决定性作用。

AI要真正成为如同水电煤般的基础资源,token成本必须实现数量级下降。

“小墨”

技术细节与性能提升

DirectCom架构通过自适应路由和智能拥塞控制,实现数据包级动态负载均衡,降低KV Cache传输对Prefill和Decode实例的影响;同时,系统拓扑与通信策略可提升推理性能与单卡MFU表现,帮助大规模应用场景实现更高效能与更低成本。

未来挑战与展望

尽管1元/百万token是一项阶段性突破,浪潮信息高层也指出这远不足以面对未来token消耗的爆发式增长。行业需持续在架构、芯片与调度等多层面创新,才能将AI推向像水电煤一样的基础设施地位,为智能体生态的长期可持续发展奠定基础。

如有侵权,请联系删除。

体验企业级AI服务

联系产品经理,扫描下方企业微信二维码

image
image

Related Articles

联系我们 预约演示
小墨 AI