SIMA 2 的系统架构与在复杂 3D 环境中的运行示例

2025年11月20日

72

842

通往通用人工智能的关键一步?DeepMind放大招,3D世界最强AI智能体SIMA 2

DeepMind 最新发布的 SIMA 2(Scalable Instructable Multiworld Agent)展示了在三维开放世界中自主规划与执行任务的能力。该智能体结合了大型模型与环境感知模块,能够理解复杂指令并在未见过的场景中生成可执行的行动序列。

SIMA 2 概述

SIMA 2 被设计为可扩展且可指令的多世界智能体,集成了类似 Gemini 的大模型用于推理与指令理解,同时配套环境模型和规划器来生成长期行动计划。相比传统强化学习代理,SIMA 2 更强调与人类的交互能力以及在开放世界中自主发现与完成任务的能力。

核心技术与能力

技术上,SIMA 2 将多模态感知、符号化规划与大模型推理结合,支持实时多轮对话来解释其行动决策并接受反馈以迭代提升技能。它能在复杂物理和虚拟场景中分解任务、生成步骤并执行,从而实现从“知道如何做”到“实际去做”的跨越。

SIMA 2 能在未见过的复杂环境中自主规划任务、解释行动步骤,并通过与用户的实时多模态对话不断迭代提升技能。

“小墨”

现实与虚拟的桥梁

在开放世界游戏、仿真训练和机器人控制等场景,SIMA 2 的表现表明具身智能体在虚拟环境中获得的技能具有高度迁移潜力。通过与用户的交互,它可以不断调整策略,减少对大量人工示例的依赖,加速从研究到工程化的落地进程。

面向未来的意义

SIMA 2 标志着通向通用人工智能的一次重要探索:把理解型大模型与环境交互能力结合,形成能在复杂现实与虚拟世界中自主规划和执行的智能体。这为具身智能、机器人自治系统以及更广泛的通用智能研究提供了新的技术路径与参考。

如有侵权,请联系删除。

体验企业级AI服务

联系产品经理,扫描下方企业微信二维码

image
image

Related Articles

联系我们 预约演示
小墨 AI