2025年7月14日
67
451
一文看懂Grok 4及“多智能体内生化”的AI新范式
就在几天前,马斯克的xAI正式发布Grok 4大模型,号称世界最强AI。我们团队这几天仔细研究了Grok 4相关的研究资料,有一些新发现,对未来AI产业趋势及算力展望具有一定价值,遂整理成此文,用一篇文章的篇幅给大家介绍清楚Grok 4的发展脉络。
核心要点
Grok 4的核心创新是在训练阶段引入多智能协作,即“多智能体内生化”。 OpenAI o1实现了“思维链内生化”;Gemini实现了“多模态内生化”;Grok 4则是率先走出了“多智能体内生化”的一步,将进一步推高基座模型的性能上限,Agent走向2.0时代。
大力出奇迹,性能登顶各大Benchmark
Grok 4是在xAI自研的Colossus超算上训练而成的,其训练规模远超前代模型,计算资源投入为Grok-2的100倍、Grok-3的10倍,实现了推理性能、多模态能力和上下文处理能力的跃升。Grok 4拥有两个版本:Grok 4(月费30美金)、Grok 4 Heavy(月费300美金,是的你没看错,300美金!)。
Grok 4作为强大的AI,并不仅在于它的计算能力,更在于它引领了多智能体协作的新时代。
“小墨”HLE:人类最后的考试
随着大模型能力的提升,许多最新模型能够在现有Benchmark表现出极高的准确率,导致这些基准失去了分辨模型智能水平的能力。因此,Center for AI Safety和Scale AI在25年初提出了HLE,即“人类最后的考试”,旨在成为最后一个广泛覆盖学术能力的封闭式基准测试。
Grok 4的核心创新:多智能体内生化
Grok 4 Heavy的核心创新在于训练阶段即引入多智能体协作,我们将其称为“多智能体内生化”。Grok 4在训练中融合了Agent调用及实时搜索等能力,将多个Agent之间的debate和self-check变成了大模型的内生能力。
随着Grok 4打响了Agent能力内生化的第一枪,各个AI大厂大概率会跟进,训练端仍然有较大的Scaling空间,新一代大模型训练的军备竞赛已然开始。(如有侵权,请联系删除。)
Related Articles
-
Wed Apr 15 2026腾讯云率先支持 Hermes Agent 云端快速部署
Hermes Agent 作为近月内走红的开源智能体项目,强调可成长性和持久记忆,并引入自我学习与技能自主创建机制。腾讯云在其轻量应用服务器 Lighthouse 上上线了专属应用模板,支持一键云端快
-
Tue Apr 14 20264月17日深圳见!观测云携手百胜软件,解锁 AI Agent 驱动的可观测性新范式
观测云与百胜软件将在深圳联合举办主题为“AI Agent驱动的可观测性新范式”的技术活动,旨在探讨如何借助智能体将海量技术指标转化为可执行的业务洞察。
-
Tue Apr 14 2026【热点速递汇编】EdgeRunner AI公司为美国太空军开发专用 AI智能体
EdgeRunner AI赢得美国太空军合同,将为其提供专用的端侧AI智能体,旨在在通信受限或中断环境中仍能为人员提供可靠的智能支持。
-
Tue Apr 14 2026【TV最前线】布局人工智能领域,中国广电四川公司发布四款AI产品
中国广电四川公司在2026年推出四款AI产品,覆盖大屏、康养、竞赛与运维等场景,强调私有化与本地化部署保障用户数据不出域。
-
Tue Apr 14 2026斯坦福HAI最新报告出炉:中国模型追平美国,95%企业AI投资零回报
斯坦福大学人类中心人工智能研究所(HAI)发布了2026年AI指数报告,报告通过多维指标评估全球AI发展态势,指出在模型性能、学术产出和产业应用等方面,中国取得显著进展,与美国在若干任务上差距明显缩小
-
Mon Apr 13 2026Anthropic 推出 Claude for Word 公测版,原生嵌入微软 Office 编辑流程/MiniMax 开源 229B 参数 M2.7 模型
Anthropic 发布了 Claude for Word 公测版,作为原生侧边栏插件它可以嵌入 Microsoft Word 编辑流程,为用户提供上下文感知的编辑建议与文档处理能力。
