By 张伟
2024年8月30日
11
370
英伟达在最新MLPerf Inference测试中大放异彩,AI定制开发新突破
MLPerf Inference发布了最新测试结果,英伟达凭借全新的Blackwell架构芯片与谷歌和AMD在性能上展开激烈竞技,展示了显著的提升,刷新了部分任务的测试纪录。MLPerf是一个被广泛认可的测试套件,以架构中立、具有代表性和可重复的方式提供机器学习系统的性能基准测试,每年更新两次,是AI解决方案和AI系统开发的重要参考。
Blackwell架构亮点:性能大幅提升
在这一轮测试中,英伟达带来了许多令人瞩目的结果。首次使用Blackwell架构,相较于上一代的H100 GPU,在Llama 2 70B模型上的性能提升高达4倍。针对每个数据中心的工作负载,H200相较于H100的性能提升高达1.5倍。同时,得益于软件改进,H200在此次提交中的表现相比上一轮预览版本提升了27%。
Blackwell架构的技术创新
Blackwell架构首次亮相是在今年3月的GTC大会上。这款尚未量产的最新芯片由2080亿个晶体管构成,采用台积电为英伟达量身定制的4nm工艺,是有史以来最大的GPU。Blackwell架构还配备了第二代Transformer引擎,并结合了新的Blackwell Tensor Core技术和TensorRT-LLM创新,能够实现快速且精确的FP4 AI推理。在本轮MLPerf测试中,B200 GPU在Llama 2 70B模型上的token吞吐量比H100 GPU高出了4倍。
MLPerf Inference发布了最新测试结果,英伟达最新的Blackwell架构芯片上场与谷歌、AMD同场竞技,展现出明显的性能提升,甚至刷新了部分任务上的测试纪录。
“新智元”提高推理效率的关键:FP4精度与内存带宽
Blackwell架构成功的关键之一在于使用4位浮点精度(FP4)进行模型运行。减少浮点数的位数一直是提高推理效率的常用手段。此前H100就引入了FP8精度,而这次Blackwell通过FP4精度在MLPerf提交中创下了新低。英伟达产品营销总监Dave Salvator指出,使用如此低精度数字的最大挑战是保持准确性,为此团队在软件方面进行了重大创新。此外,Blackwell的内存带宽几乎翻倍,达到8TB/s,而H200则为4.8TB/s。
AI性能提升的未来:推动AI企业解决方案与AI定制开发
英伟达此次在MLPerf Inference测试中的出色表现,为AI企业解决方案和AI定制开发带来了全新机遇。Blackwell架构的创新不仅展示了在高性能计算和机器学习上的领先地位,还为大型语言模型开发和AI应用定制服务提供了强大支持。借助这些突破性技术,企业将能够更高效地实现ChatGPT开发、Langchain框架集成等应用,推动AI技术在教培行业AI应用、税务AI咨询等领域的发展。
如有侵权,请联系删除。
Related Articles
-
Tue Jun 09 2026智能体时代CPU回'C位',英特尔至强6+重塑AI底座
随着Agentic AI从实验室走向规模化落地,数据中心对算力的结构性需求发生显著变化。英特尔在北京发布会上提出,CPU正在从训练边缘化后的回归阶段承担更多在线推理、协调与编排任务,成为AI部署的关键
-
Tue Jun 09 2026百奥几何完成新一轮数亿元融资,以'微观世界模型'构筑Bio AI基础设施
百奥几何宣布完成新一轮数亿元战略融资,由上海生物医药创新转化基金与国科投资等联合领投,公司专注于将生成式AI应用于生命科学,打造微观世界模型以实现自主科学发现。
-
Tue Jun 09 2026王慧文,投了一家AI短剧公司
2026年6月,井英科技宣布完成数千万美元的A轮及A+轮融资,投资方包括王慧文家族办公室与蚂蚁集团等。公司定位于AI短剧赛道,致力于将生成式AI与Agent能力融合,打造从创作到分发的端到端闭环。
-
Mon Jun 08 2026【计算机】海外巨头融资提速,AI应用静待续催化——计算机行业6月投资策略展望
本报告从投资策略视角出发,分析了截至2026年6月计算机行业的资金流向与应用进展,强调海外巨头在本轮融资中的加速布局以及对下游应用生态的潜在影响。
-
Mon Jun 08 20262026年1-5月全球AI制药融资全景
本文系统盘点了2026年1至5月期间全球AI制药领域的重要融资事件与市场动向,解析资本如何围绕算法、数据与试验能力重构药物发现生态。
-
Mon Jun 08 2026华为云突放十几款 AI 新品!AI 云入口战,正式开打!
在INSPIRE创想者大会上,华为云发布了十几款围绕Agentic AI的新品,覆盖算力、存储、调度、记忆与运行环境,目标是为企业级智能体提供从开发到部署的全流程支持。
-
Mon Jun 08 2026宇信科技'星睿智调'入选'2026中国AI智能体领航者'榜单
宇信科技自研的'星睿智调'信贷尽调智能体被评为2026中国AI智能体领航者,成为金融行业智能体规模化应用的代表案例之一,展现出在尽职调查环节的高效能力。
-
Sun Jun 07 2026脑机接口、AR眼镜、智能体……,浙商如何抢抓AI风口
第23届浙商(投融资)合作周在杭州举行,聚焦智能体时代的裂变,讨论从具身智能到脑机接口与AR终端的技术与商业路径。
-
Sun Jun 07 2026“AI x开源鸿蒙” 智启新五年:Agent OS从概念走向系统,从系统走向生态,从生态走向真正的产业价值
在上海交通大学的开源鸿蒙城市技术论坛上,项目群技术指导委员会强调智能体时代需要新的操作系统范式,以系统层能力支撑概率性AI的确定性需求。
-
Sun Jun 07 2026脑机接口 、AR 眼镜、智能体……,浙商如何抢抓 AI 风口
第23届浙商(投融资)合作周在杭州召开,以'智能体时代的裂变'为主题,汇聚行业代表与投资人,共同探讨AI在传统产业中的应用与投融资机会。
-
Sat Jun 06 2026踏上AI +绿色发展新征程,中国铁建'铁骥'大模型重磅上线!
中国铁建发布'铁骥'大模型,作为面向全集团的自研智能底座,目标覆盖工程项目从勘察到运维的全流程,支持绿色建设与数字化管理。
-
Sat Jun 06 2026288核,Intel 18A制程,英特尔至强6+加速Agentic AI落地
英特尔在北京发布会上推出新一代至强6/6处理器,面向Agentic AI时代的数据中心需求,强调CPU在整体算力架构中的回归与重要性。
-
Sat Jun 06 2026中国电信研发云CodeFree荣获"2026中国AI智能体领航者"称号
中国电信研发云CodeFree在2026年评选中获得'通用智能体'方向称号,入选《2026中国智能体产业图谱》,其方案面向央国企研发痛点构建国产化芯片到研发工具链的全链路自主可控体系。
-
Sat Jun 06 2026大厂Agent天团已就位!AI智能体时代年度盛会进展公布,同期自进化智能体研讨会嘉宾揭晓
AgenticAICon 2026 将于杭州举办,作为聚焦AI智能体技术与应用的年度盛会,会议旨在连接学术、产业与投资三端,推动智能体技术的可落地发展。
-
Sat Jun 06 2026中国电信研发云CodeFree荣获“2026中国AI智能体领航者”称号
2026年6月,中国电信研发云CodeFree凭借其在通用智能体方向的技术突破与应用实践,被授予“2026中国AI智能体领航者”称号,并入选《2026中国智能体产业图谱》。
-
Fri Jun 05 2026达实召开生态伙伴大会,“AI+平台”实现快速迭代
达实智能在生态伙伴大会上展示AI Agent 2.0的演进速度与应用广度,强调通过AIoT平台和场景化模型快速复制落地,实现从单点到大规模场景覆盖的跨越。
-
Fri Jun 05 2026让AI深入产线!第三期『场景恳谈会』AI+制造业专场干货实录
第三期'场景恳谈会'聚焦 AI 在制造业的实际应用,来自企业与研究机构的案例展示说明 AI 智能体正从试点进入规模化部署阶段。
-
Fri Jun 05 2026智启新程,生态同行:2026高通汽车技术与合作峰会展现AI汽车新图景
2026高通汽车技术与合作峰会在无锡举行,聚焦AI智能体在汽车场景的落地与生态合作,展示了面向车载多模态交互、舱驾一体化和智能体验的解决方案。
