智谱GLM-5.1实现开源模型重大突破:首次全面对标Claude Opus 4.6

2026年4月8日

16

775

智谱GLM-5.1实现开源模型重大突破:首次全面对标Claude Opus 4.6

2026年4月,智谱发布开源大模型GLM-5.1,这是一个在AI工程能力上具有里程碑意义的突破。该模型首次实现了与当前全球最顶尖闭源模型Claude Opus 4.6的全面对齐,标志着开源模型正式进入与闭源模型正面竞争的新阶段。

专家级直觉与自主决策能力

GLM-5.1最引人瞩目的成就在CUDA Kernel优化领域。测试显示,该模型在14小时内自动完成CUDA性能优化,将加速比从2.6倍提升至35.7倍——而这在传统方式下,需要资深CUDA工程师花费数月反复测试、调优才能达成。

SWE-bench Pro登顶:工程能力获权威认可

GLM-5.1展现出令人惊讶的专家级决策能力。在优化初期,它首先尝试在现有高层框架内寻找解法;当测试发现性能触及天花板后,它自主做出决策——放弃高层框架,直接转向底层C++进行重写。这是一个典型的人类专家思维模式,表明AI已具备真正的工程推理能力,而非仅仅执行预定指令。

2026年的AI,将成为能真正落地做事的「doer」。

“红杉资本”

在被称为「软件工程能力试金石」的SWE-bench Pro基准测试中,GLM-5.1刷新了全球最佳成绩,超越Claude Opus 4.6、GPT-5.4等头部模型拿下第一。这一结果不仅验证了GLM-5.1的技术实力,更意味着中国开源AI在核心工程能力上已与全球前沿并驾齐驱。

突破分钟级交互:8小时长程任务能力 GLM-5..1的核心突破在于实现了业界领先的长程任务(Long Horizon Task)能力。与主流模型的「分钟级交互」模式不同,它能够持续、自主工作长达8小时以上。在实测中,它能在1小时内从零构建MacOS桌面环境,8小时内交付完整Linux桌面系统,甚至用655轮迭代将向量数据库性能提升6.9倍。这种能力本质上是将AI的交付单位从「一行代码」提升到「完整项目」。

如有侵权,请联系删除。

Related Articles

联系我们 预约演示
小墨 AI