豆包手机详细展示与 GUI Agent 工作示意图

2025年12月9日

37

824

起底“豆包手机”:核心技术探秘早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

字节跳动与中兴联合推出的“豆包手机”通过将系统级 GUI Agent 与大模型能力整合,展示了将 AI 智能体深度嵌入手机操作系统以实现跨应用自动化任务与本地持久记忆的可行性。

产品与合作背景

该机型以字节跳动负责 AI 软件能力、中兴努比亚负责硬件研发为分工,推出工程样机(如 nubia M153),并以技术预览形式少量发售,旨在将 AI 能力作为“数字协作者”嵌入移动终端核心交互路径。

核心技术与开源情况

豆包团队将核心智能体能力与界面操作能力结合,部分推理引擎与配套工程基建对外开源(如社区披露的 GELab-Zero 等项目),以便在主流安卓设备上实现轻量化部署与一键推理体验。

将 AI 从工具提升为数字协作者,把手机变成你的秘书。

“小墨”

功能与用户场景

系统级 GUI Agent 可通过语音指令执行复杂跨应用流程(比价下单、批量操作、消息代发等),并具备屏幕记忆与多步任务拆解能力,极大提升移动交互效率。

争议与限制

尽管技术展现出强大潜力,但发布后迅速引发生态冲突:部分社交、金融、电商平台限制或封禁相关功能,官方被迫下线涉及社交和金融的操作权限,凸显隐私、权限与生态利益冲突等监管与协作难题;同时开源带来开发者生态成长与供应链适配挑战。

如有侵权,请联系删除。

体验企业级AI服务

联系产品经理,扫描下方企业微信二维码

image
image

Related Articles

联系我们 预约演示
小墨 AI