blog details

2024年6月3日

24

334

昆仑万维开源Skywork-MoE大模型,AI解决方案再获突破

6月3日,开源大模型领域迎来了一则重要消息:昆仑万维宣布开源其最新的2千亿稀疏大模型Skywork-MoE。这一AI解决方案不仅性能强劲,还大幅降低了推理成本。

Skywork-MoE目前是能够在8x4090服务器上进行推理的最大开源MoE模型。每个8x4090服务器拥有192GB的GPU显存,在FP8量化模式下,模型权重占用仅146GB。采用昆仑万维团队首创的非均匀Tensor Parallel并行推理方式,Skywork-MoE在合适的batch size条件下,可以达到2200 tokens/s的吞吐量。

Skywork-MoE:顶尖性能与先进技术

对于AI定制开发社区来说,Skywork-MoE的开源是一大福音。模型权重、技术报告全面开放,免费商用且无需申请,这将极大促进大型语言模型开发和AI企业解决方案的应用与创新。

6 月 3 日,开源大模型领域又传来重要消息:昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE,在保持性能强劲的同时,大幅降低了推理成本。

“机器之心”

完全开源,推动AI定制开发

昆仑万维的创新不仅吸引了教育行业的关注,在杭州AI定制开发领域更是备受瞩目。从教育行业AI解决方案到税务AI咨询,再到企业的各种定制化需求,Skywork-MoE为ChatGPT开发和使用Langchain框架的大模型开发提供了极大的技术支持。

在浙江省,尤其是杭州,AI企业服务正在迅速崛起。昆仑万维的Skywork-MoE大模型将为本地的AI应用定制服务和AI系统开发提供更多可能性,不仅在教育、税务等垂直行业中应用广泛,还将提升企业的整体效率。

如有侵权,请联系删除。

Related Articles