blog details

2025年3月11日

24

419

Manus掀起智能体复现热潮,DeepSeek成协作焦点

随着Manus的横空出世,智能体领域迎来了新的爆发。在这波复现热潮的推动下,DeepSeek已被成功整合到多个智能体协作项目中,相关开源项目频频登上榜单,吸引了众多海外大咖争相求码。推动这场浪潮的公司蝴蝶效应,不仅复兴了智能体赛道,也让开源复现和商业闭源产品加速内卷。截至目前,跑得最快的两个开源项目分别是OpenManus和OWL,其中后者已将DeepSeek模型嵌入到多智能体协作框架中,极大提升了智能体之间的联动效率。此外,围绕Manus爆火所引发的另一个副作用是,行业内对GAIA测试基准的追逐也渐成局面,抢占GAIA榜单俨然成为智能体类产品的竞争新焦点。

GAIA由Meta AI、HuggingFace和AutoGPT团队联合推出,是新一代智能体性能对标的核心测试工具。这一项目由图灵奖得主Yann LeCun和HuggingFace首席科学家Thomas Wolf共同发起,主要解决现有大语言模型基准测试快速过时、难以公正评估等问题。GAIA测试基于超过450个复杂问题集设计,包括三个层次的难度级别,通过工具使用能力、自主决策能力等维度检验智能体的实际表现。

GAIA基准测试:智能体领域的新竞技场

类似于ImageNet数据集开创了深度学习时代的先例,每个技术浪潮都会孕育新的测试基准。BERT时代有CLUE与SuperCLUE对语言理解的深度验证;大语言模型兴起后,MMLU和用户喜爱的大型模型竞技场如ChatBot Arena成为衡量大模型能力的重要指标。当前,智能体类产品在GAIA测试上的竞争日益激烈,正逐渐成为行业最新的共识。

随着Manus的横空出世,智能体领域迎来了新的爆发。

“小墨”

智能体赛道不断演进,GAIA成行业新风向标

在Manus带动的热潮中,DeepSeek因为其独特的性能表现而受到广泛关注,成功整合到多个智能体复现和协作框架中,进一步增强基于AI工作流和智能体开发平台的技术能力。这不仅提高了多智能体系统的工具组合应用效率,也成为推动私有化DeepSeek部署、企业级AI知识库搭建和多模态协作能力提升的重要一环。正因如此,DeepSeek成为智能体商用落地的关键组成部分。

从GAIA测试的广泛应用到智能体技术框架的进化,智能体生态正在走向更高效、更创新的未来。如同ChatGPT、Claude和Gemini曾掀起行业热潮一样,Manus和相关技术的引领也展示了智能体技术落地的潜力。依托积墨AI等AI智能体开发平台,结合大语言模型应用与智能体行业解决方案,AI技术未来将持续赋能企业生产效率、优化资源管理,推动企业和行业智能化转型。

如有侵权,请联系删除。

Related Articles

联系我们预约演示
小墨 AI