By 积墨AI

2025年12月25日

612

推理成本打穿1元/百万token，浪潮信息推动Agent规模化的“最后一公里”

浪潮信息近日推出名为元脑HC1000的超扩展AI服务器，宣称将大模型推理成本首次降至1元/每百万token。该产品以全对称DirectCom极速架构为核心，旨在通过体系级的设计优化打破当前智能体规模化落地的成本瓶颈。

元脑HC1000与DirectCom架构

元脑HC1000采用无损超扩展设计，每计算模组配置16颗AIPU，使用直达通信实现超低延迟，并以计算与通信1:1均衡配比保障全局无阻塞通信。该架构支持按需配置计算实例，最大化资源利用率，从而显著提升推理吞吐与性价比。

成本下降的行业意义

推理成本下降至1元/百万token被视为打通智能体‘最后一公里’的关键一步。随着智能体对超长上下文、多步规划等复杂任务的需求激增，token消耗呈指数级增长，降低单token成本对商业化与普惠化具有决定性作用。

AI要真正成为如同水电煤般的基础资源，token成本必须实现数量级下降。

“小墨”

技术细节与性能提升

DirectCom架构通过自适应路由和智能拥塞控制，实现数据包级动态负载均衡，降低KV Cache传输对Prefill和Decode实例的影响；同时，系统拓扑与通信策略可提升推理性能与单卡MFU表现，帮助大规模应用场景实现更高效能与更低成本。

未来挑战与展望

尽管1元/百万token是一项阶段性突破，浪潮信息高层也指出这远不足以面对未来token消耗的爆发式增长。行业需持续在架构、芯片与调度等多层面创新，才能将AI推向像水电煤一样的基础设施地位，为智能体生态的长期可持续发展奠定基础。

如有侵权，请联系删除。

推理成本元脑HC1000 浪潮信息 DirectCom AIPU 智能体落地规模化低成本推理积墨AI AI智能体 AI智能体平台私有化AI智能体平台企业级AI智能体

Share This Post

推理成本打穿1元/百万token，浪潮信息推动Agent规模化的“最后一公里”

元脑HC1000与DirectCom架构

成本下降的行业意义

技术细节与性能提升

未来挑战与展望

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

熵基科技Change-Maker大会即将启幕！BCI×AI解锁空间智能新图景

英矽智能受邀出席摩根士丹利中国峰会，深度探讨AI医药应用新篇章

北京大学OpenClaw系列（二）："养虾"60天，GitHub 25万星：这份内部指南揭露了AI Agent的隐秘江湖

AI Agent 商业化落地潮：2026年成企业服务元年

智能体主机了解一下，AMD锐龙AI AI Max系列定义端侧AI制高点

GDPS大会特邀自然资源和规划行业AI应用专场：《"源界"AI · "素造空间"》详细议程发布

特钢公司党委组织开展AI赋能专题培训

20MW以上项目停建！美国议员桑德斯、AOC联手推出AI数据中心暂停法案

金融AI领跑者「讯兔科技」完成近2亿元A轮融资，全面推进Agent生态

AI Agent元年：OpenClaw如何重塑AI商业化路径与资本市场映射

3月26日AI全球眼：苏纳克解读AI四大准则；中国AI内卷深陷投资消耗战；国产AI手机角逐OpenClaw浪潮；Meta组建AI原生专项小组

新潮传媒张继学：AI与即时零售时代，品牌的生存与发展机会

AI 原生调度器、安全运行时与智能体原生云（2026.03.24）

Token调用量连续三周超越美国！我们正在见证AI的“中国时刻”

Kimi创始人杨植麟：未来AI研发将进入AI主导时代！公司估值已达180亿美元，3个月内翻了4倍

Meta收编AI智能体公司Dreamer，前Oculus VR负责人的雨果·巴拉回归

Geordie AI：企业 AI Agent 安全治理体系的构建者

Agentic AI安全与治理厂商Geordie AI获得RSAC 2026创新沙盒冠军

一个月内狂揽104亿，为什么AI'吸金'独角兽都在海淀？

2026年3月24日：Mistral AI 首席执行官提议欧洲对人工智能企业征收在线公开内容使用税

阿里达摩院明日发布芯片新品，瞄准AI Agent算力需求

AI产业化进程加速，安全治理亟待跟进

AI 原生调度器、安全运行时与智能体原生云（2026.03.24）

玄铁再进化！达摩院或推全球首款Agent专用RISC-V芯片

硬科技周期中的“清华现象”：24天融资超百亿

直播预告：“源界”AI系列首发，“懂空间、通业务、可解释、会演进”的自然资源和规划领域高质量智能体

OpenClaw赋能智造！区政协领导走进华南三弦，共探AI智能体新未来

量子位智库AI内参

放弃观望，选择押注，外企的中国AI投资逻辑变了

“科技大讲堂”首期开讲 前沿AI解锁科创新思维

攻防重构时代，AI 守护数字安全！龙虾护卫 AI Agent 安全防控产品发布会重磅启幕

智能体原生模型爆发与企业 AI 工厂建设（2026.03.22）

7.87亿美元！华深智药引爆2026：当美元潮汐遭遇AI制药，谁是真正的买单人？

李飞飞等14位斯坦福微软大牛等撰写《AGENT AI: 综述多模态交互的前沿展望》免费pdf分享

电信新业务全国上线；字节超60亿美元出售沐瞳科技；腾讯云AI业务突发调整；马斯克：进军2nm芯片制造；华为Mate 80系列销量突破453万台

腾讯"小龙虾"来了！互联网与AI分会OpenClaw系列活动解锁AI智能体实战新路径

赛迪顾问：OpenClaw引爆智能体浪潮，AI云全栈服务驶入快车道（2026年第5期（总第69期））

硬件豪赌、AI 原生 OS 转向与智能体生态爆发（2026.03.23）

AI智能体加速落地 商业保险迎补位时刻

AI行业动态日报：AI正在重写SEO规则/Token消耗纳入绩效考核…

赛迪顾问：OpenClaw引爆智能体浪潮，AI云全栈服务驶入快车道

华为云AI战略升级：以行业智能体为中心，打造企业级AI创新“黑土地”

火石创造×华为：“城市智能中枢”AI旗舰解决方案，赋能城市核心竞争力建设

专访凯文·凯利：还没有真正的AI专家出现！

当算力遇见枢纽 你会如何“AI”上这座城？

北邮-里昂2026创客新春论坛成功举办

【投融资】AI编程初创公司Cursor最新一轮估值500亿美元，ARR已达20亿

库克：迫不及待想看中国AI下一步发展！苹果CEO在中国发展高层论坛2026年年会上发声

AI大爆发，药企入局时机到了

从世纪互联到AI原生超互联：「电粒世界」从常州走来

Manus之后，OpenClaw带领Agent彻底爆发，7月深圳，Agentic AI Summit会议分享从模型选型到全域落地

连续四年线下出席中国发展高层论坛，博乐仁再谈工业 AI 革命

双突破！热景生物12分钟「全血」快检化学发光C2100、唯一搭载AI智能体流水线LAS-H2震撼首发

30亿，宜兴首支AI产业基金落地

库克：迫不及待想看中国AI下一步发展！苹果CEO在中国发展高层论坛2026年年会上发声

OpenClaw 的 ChatGPT 事件引发了人们对人工智能模型正逐渐商品化的担忧

从世纪互联到AI原生超互联：'电粒世界'从常州走来

法律AI厂商Harvey赞助达拉斯小牛队；Factor发布《2026年生成式AI法律基准报告》

智能体原生模型爆发与企业AI工厂建设（2026.03.22）

事关居民增收、应对AI冲击，韩文秀详解未来5年新机遇

让机器人听懂人话！华为开源具身智能框架，动动嘴就能指挥机器人完成复杂任务

库克：迫不及待想看中国AI下一步发展！苹果CEO在中国发展高层论坛2026年年会上发声

双突破！热景生物12分钟「全血」快检化学发光C2100、唯一搭载AI智能体流水线LAS-H2震撼首发

杜小东出席AI智能体应用落地实践大会

微信可以用'龙虾'了！

阿里巴巴蔡崇信：AI的终极目标是造福社会

智能体原生模型爆发与企业 AI 工厂建设（2026.03.22）

连续四年线下出席中国发展高层论坛，博乐仁再谈工业 AI 革命

法律 AI 厂商 Harvey 赞助达拉斯小牛队；Factor 发布《2026 年生成式 AI 法律基准报告》

微信可变电脑遥控器、OpenAI推超级应用、贝佐斯发力太空AI

“科技大讲堂”首期开讲前沿AI解锁科创新思维

AI智能体加速落地商业保险迎补位时刻

当算力遇见枢纽你会如何“AI”上这座城？

创业慧康联合发布医疗行业推理一体机以AI智能体架构赋能智慧医院新生态