blog details

2024年9月23日

24

419

阿里Qwen2.5震撼发布,性能超越Llama3.1,开创AI新纪元

今日,阿里云发布了全球最强开源大模型Qwen2.5-72B,其性能“跨量级”超越了Llama3.1-405B,重新登顶全球开源大模型的王座。此次发布包含一系列Qwen2.5模型,如语言模型Qwen2.5、视觉语言模型Qwen2-VL-72B、编程模型Qwen2.5-Coder,以及数学模型Qwen2.5-Math等,累计超过100个型号,其中部分模型的性能甚至赶超了GPT-4o,刷新了世界记录。这一革命性的进展,为AI解决方案和AI定制开发提供了新的可能性。

自2023年4月以来,通义千问Qwen迅速成长,现已成为仅次于Llama的世界级模型群。根据阿里云CTO周靖人公布的数据,截至2024年9月中旬,Qwen开源模型的累计下载量已经突破4000万,衍生大模型超过5万个。Qwen2.5支持高达128K的上下文长度,可生成最多8K的内容,支持超29种语言,为用户提供了强大的AI企业解决方案和多语言支持。

Qwen2.5的卓越性能:开源下载量突破4000万

基于18T token数据预训练,Qwen2.5相比Qwen2提升了18%以上的整体性能,具备更强的知识、编程和数学能力。Qwen2.5-72B在多个基准测试(如MMLU-rudex、MBPP、MATH)中表现出色,得分分别为86.8、88.2和83.1。这个拥有720亿参数的模型,性能甚至超越了涵盖4050亿参数的Llama3.1-405B,为大型语言模型开发提供了新的标杆。

今日,阿里云推出全球最强开源大模型Qwen2.5-72B,性能“跨量级”超越Llama3.1-405B,再登全球开源大模型王座。

“机器之心”

AI模型在多领域的突破:语言、编程和数学

阿里云在云栖大会上宣布,Qwen2.5系列合计开源模型超过100个,充分满足各类开发者和中小企业的需求。这些模型包括7个尺寸的语言模型,从0.5B到72B均实现了业界最佳(SOTA)成绩。Qwen2-VL具备视觉智能体能力,能够识别不同分辨率和长宽比的图片,理解长视频内容,其视觉理解能力超越了GPT-4o,为AI应用定制服务和AI系统开发提供了强大支持。

通义千问旗舰模型Qwen-Max也实现了全面升级,MMLU-Pro、MATH等十多个基准测试中已接近甚至超越GPT-4o。用户现在可以通过通义千问官网和通义APP,更高效地调用Qwen-Max的API功能,这无疑将为ChatGPT开发和杭州AI定制开发注入新的活力。

如有侵权,请联系删除。

Related Articles