By 张伟
2024年10月21日
24
419
英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快
英伟达最新推出的nGPT为AI解决方案带来了巨大进步,其AI训练速度大幅提升,达到了传统方法的20倍。新架构基于超球面进行表示学习,不仅加快了训练速度,还保持了原有的精度。随着文本长度的增加,nGPT的加速效果愈加明显,这项进步为AI定制开发注入了强心剂,推动大型语言模型开发接近AGI的终极目标。
高效的AI系统开发环境
nGPT团队通过创新的训练理念使得所有向量归一化为单位范数,企业AI开发者因此可以在时间与资源的使用上大幅节省。在超球面表面,token移动时,位移由MLP和注意力模块定义,达到相同精度所需的训练步骤减少4-20倍,依赖于序列长度的不同。这无疑为AI企业解决方案中的开发人员提供了高效的AI系统开发环境。
提高训练稳定性
为了增强模型的训练稳定性和推理成本问题,nGPT实验表明,归一化技术对提升Transformer性能至关重要,比如应用LayerNorm和RMSNorm。研究甚至发现利用权重衰减技术可以控制权重范数,进一步提升模型性能。随着更多研究应用于旋转而非仅仅向量范数,AI私有云部署的研究人员能够提高训练稳定性和嵌入空间的可分离性,创造出了更具竞争力的模型。
为了改进其训练稳定性、推理成本、上下文长度、鲁棒性等方面,AI科学家已进行了大量的修改尝试。其中,最突出的发现是,归一化技术对于Transformer性能改善起着重要作用。
“新智元”改进方法
nGPT架构也统一了Transformer领域的多种观察和发现,通过在嵌入过程中实施归一化,提升了模型预测token的精确度。随着输入序列的前序tokens预测后续token,模型训练过程中引入了新的嵌入矩阵Einput和Eoutput以增强预测准确性。这种改进为使用Langchain框架的AI案例提供了提高训练效率的有效方法。
结语
通过因果掩码技术,nGPT智能体确保模型在预测token时不会泄露后续词的信息,进而提高了训练的效率与准确性。这为ChatGPT开发提供了更多的改进方向,并加速推动ChatGPT在企业中的应用的拓展,展现出英伟达在AI技术上的持续领导力。
如有侵权,请联系删除。
Related Articles
-
Sun Jun 07 2026脑机接口 、AR 眼镜、智能体……,浙商如何抢抓 AI 风口
第23届浙商(投融资)合作周在杭州召开,以'智能体时代的裂变'为主题,汇聚行业代表与投资人,共同探讨AI在传统产业中的应用与投融资机会。
-
Sat Jun 06 2026288核,Intel 18A制程,英特尔至强6+加速Agentic AI落地
英特尔在北京发布会上推出新一代至强6/6处理器,面向Agentic AI时代的数据中心需求,强调CPU在整体算力架构中的回归与重要性。
-
Sat Jun 06 2026中国电信研发云CodeFree荣获“2026中国AI智能体领航者”称号
2026年6月,中国电信研发云CodeFree凭借其在通用智能体方向的技术突破与应用实践,被授予“2026中国AI智能体领航者”称号,并入选《2026中国智能体产业图谱》。
-
Sat Jun 06 2026中国电信研发云CodeFree荣获'2026中国AI智能体领航者'称号
中国电信的研发云產品CodeFree在2026中国AI智能体领航者评选中获得通用方向智能体称号,体现了其在研发场景中应用智能体的实力与创新能力。
-
Fri Jun 05 2026达实召开生态伙伴大会,“AI+平台”实现快速迭代
达实智能在生态伙伴大会上展示AI Agent 2.0的演进速度与应用广度,强调通过AIoT平台和场景化模型快速复制落地,实现从单点到大规模场景覆盖的跨越。
-
Fri Jun 05 2026智启新程,生态同行:2026高通汽车技术与合作峰会展现AI汽车新图景
2026高通汽车技术与合作峰会在无锡举行,聚焦AI智能体在汽车场景的落地与生态合作,展示了面向车载多模态交互、舱驾一体化和智能体验的解决方案。
-
Fri Jun 05 2026智启新程,生态同行:2026高通汽车技术与合作峰会展现AI汽车新图景
在无锡举行的高通汽车技术与合作峰会上,高通展示了面向汽车的AI能力,强调汽车正演进为重要的移动智能体载体,并提出了舱驾一体的交互愿景。
-
Fri Jun 05 2026Agentic AI风口已至!聚焦Agent最火的九个方向,年度AI智能体大会7月开幕
2026中国AI智能体大会将于7月2-3日在杭州举办,主题为“范式跃迁 重塑世界”,大会聚焦智能体技术的前沿方向与产业应用,邀请了大量来自企业与学界的专家。
-
Fri Jun 05 2026智启新程,生态同行:2026高通汽车技术与合作峰会展现AI汽车新图景
在2026高通汽车技术与合作峰会上,高通中国区领导指出2026年将成为“智能体之年”,并展示了其面向智能体的车载计算、感知与软件平台,强调汽车将成为智能体AI最重要的移动载体。
-
Fri Jun 05 2026汤道生对谈姚顺雨,回答关于腾讯AI的一切
在腾讯云 AI 产业应用大会上,腾讯高层就公司在 AI 下半场的战略与产品做出详细阐述,重点介绍面向企业的效率智能体与办公套件,旨在将智能体能力直接嵌入企业工作流中以提升生产力。
-
Fri Jun 05 2026华为云发布Agentic AI系列新品 打造智能时代“硅基黑土地”
在INSPIRE创想者大会上,华为云正式提出Agentic Infra新范式,并同步发布一系列面向企业级应用的Agentic AI产品,目标是为智能体时代提供从算力到平台的完整基础设施。
-
Fri Jun 05 2026选型、演进、实战:腾讯云AI产业应用大会,16个专场拆解Agent产品底层逻辑
腾讯云组织的AI产业应用大会聚焦Agent技术在产业场景的落地与工程化,安排16个专场从基础设施到应用实践全链路讨论,面向开发者、产品与决策者。
-
Fri Jun 05 2026华为云发布Agentic AI系列新品 打造智能时代"硅基黑土地"
在INSPIRE创想者大会上,华为云正式提出Agentic Infra新范式,展示面向企业的端到云一体化能力,强调通智一体化基础设施对企业智能体落地的重要性。
-
Fri Jun 05 2026中国信通院即将发布2026年首批可信AI智能体评估结果
中国信息通信研究院将于6月9日召开智能体高质量发展研讨会,并发布2026年上半年可信AI智能体评估结果,为行业提供评估结论与改进建议。
-
Fri Jun 05 2026华为云发布Agentic AI系列新品 打造智能时代'硅基黑土地'
在INSPIRE创想者大会上,华为云正式提出Agentic Infra新范式,展示了面向企业的Agentic AI系列新品,旨在通过算力、模型和工程平台的协同,为企业级智能体提供可控且高效的基础设施。
-
Fri Jun 05 2026浪潮海岳智能体荣膺'2026中国AI智能体领航者'
浪潮数字企业旗下的海岳智能体在2026中国AI智能体领航者榜单中获得认可,其面向基建工程的施工方案编制智能体展示了将行业知识与多智能体协同应用于工程场景的能力。
-
Thu Jun 04 2026达实智能召开生态伙伴大会,“AI+平台”实现快速迭代
在生态伙伴大会上,达实智能展示了其AI Agent 2.0的演进成果,强调通过平台化、模块化的方式实现智能体在不同场景中的快速复制与迭代。
-
Thu Jun 04 2026据称推进微信 AI Agent,14 亿用户入口待合规
消息显示,腾讯已在内部测试微信AI Agent的原型,目标是将智能体能力嵌入微信丰富的生态中,不仅限于聊天对话,而是帮助用户在支付、小程序与内容服务间完成复杂任务。
