Egocentric-10K:面向具身智能的千小时第一视角工业视频数据集

2025年11月18日

73

637

18岁华人开源成果,火爆具身智能赛道

Eddy Xu 与其团队 Build AI 发布了 Egocentric-10K,这是一个面向人类中心(human-centric)的第一视角工业作业数据集,包含约10亿帧视频、2153名工人、1万小时真实工厂工作,总规模约16.4TB,在 Hugging Face 上线后短期内下载量激增。

数据集规模与构成

Egocentric-10K 覆盖大规模真实工业作业,采集自多名现场工人与多种作业类型,包含视频帧、动作标注与时间序列信息。数据量与多样性显著超越此前公开数据集,适用于具身智能、机器人感知与智能体决策等研究。

开源与技术策略

该项目采用开放获取策略,在 Hugging Face 平台发布,保证研究者与工业界能够复现、微调与扩展基线模型。团队在数据采集与隐私保护方面采用了去标识化与合规流程,以利于大规模共享与长期维护。

Egocentric-10K 已成为新一代具身智能、AI智能体领域的重要基础资源。

“小墨”

产业与研究影响

Egocentric-10K 为新一代具身智能与AI智能体提供了实证基础,尤其在工业自动化、操作流程理解与人机协作领域具有重要价值。它有望加速从模拟到真实场景的模型迁移,并推动企业级智能体解决方案的落地。

应用前景与挑战

尽管数据规模巨大并具备高价值,但在标注一致性、场景多样性与领域适配上仍有挑战。后续工作可聚焦于高质量语义标注、少样本迁移和隐私合规工具,以提升数据对下游任务的支持力度。如需在具体工业场景中部署,还需结合算力、推理效率与系统工程的优化。

如有侵权,请联系删除。

体验企业级AI服务

联系产品经理,扫描下方企业微信二维码

image
image

Related Articles

联系我们 预约演示
小墨 AI