SIMA 2 在复杂三维虚拟环境中的交互与决策示意图

2025年11月20日

67

845

通往通用人工智能的关键一步?DeepMind放大招,3D世界最强AI智能体SIMA 2

DeepMind 最新发布的 SIMA 2 被定位为可扩展、可指引的多世界智能体研究的重要进展。项目通过将 Gemini 模型与复杂 3D 环境交互能力结合,使智能体能够在未见过的虚拟场景中理解指令、规划行动并不断通过闭环反馈自我优化。

SIMA 2 的核心能力

SIMA 2 在架构上整合了大型通用模型与环境交互模块,支持自然语言指令理解、长期记忆与实时对话能力。它能够依据场景动态规划行动序列,并在执行后通过观测结果调整策略,从而实现适应性学习。

在三维开放世界中的表现

在复杂游戏和模拟环境测试中,SIMA 2 展示了较强的零样本泛化能力,能够在未训练的地形或规则下完成目标驱动的任务,这体现出其对环境模型与行动策略的深度整合能力。

它不仅能遵循人类指令,还能在游戏等开放世界中自主决策,预示AI智能体将成为未来物理世界核心的认知构建模块。

“小墨”

与机器人和行业应用的潜在连接

SIMA 2 的能力预示着智能体有望成为未来物理世界认知构建的核心模块,推动机器人在感知-决策-控制层面的跃迁,同时为自动化生产、仿真训练与虚拟助理等场景带来新的可能。

未来展望与挑战

尽管 SIMA 2 展示了令人瞩目的能力,但从模拟环境到真实物理世界仍存在感知鲁棒性、长期安全性与成本效率等挑战。研究将需要在模型可解释性、数据效率与伦理治理上持续投入,以推动可持续落地。

如有侵权,请联系删除。

体验企业级AI服务

联系产品经理,扫描下方企业微信二维码

image
image

Related Articles

联系我们 预约演示
小墨 AI