多智能体协同训练与工具调用效果示意图

2025年11月8日

88

642

LLM强化学习新框架!UCSD多智能体训练框架让LLM工具调用能力暴增5.8倍

加州大学圣地亚哥分校提出PettingLLMs,多智能体训练框架通过群体强化学习显著提升大语言模型在工具调用上的能力,论文展示了工具调用能力提升约5.8倍的结果,为LLM在复杂任务中的工程化应用提供了新思路。

研究方法与架构

框架通过让多个智能体在共享环境中协作学习,利用群体奖励与通信机制优化决策过程。不同智能体分工并互相调用工具,形成协同策略,从而提高整体任务完成率与工具使用效率。

性能提升与实验结果

研究团队在多项基准任务上评估了框架效果,结果显示未经专门训练的群体智能体也能在多领域任务中超越单体表现,工具调用成功率和任务完成速度均有显著提升。

群体智能体在未经过专门训练的情况下,也能在多领域任务中优于单体表现。

“小墨”

潜在应用与企业价值

PettingLLMs的思路可应用于企业自动化办公、复杂决策支持与多角色协作系统。通过多智能体协作,企业能将LLM能力扩展到更复杂的工作流与工具链中,提升生产力与自动化水平。

挑战与未来方向

尽管群体训练展现出强大潜力,但依然面临通信成本、稳定性与安全性等挑战。未来需在可扩展性、训练效率以及对抗鲁棒性方面持续改进,推动技术在工业界的落地应用。

如有侵权,请联系删除。

体验企业级AI服务

联系产品经理,扫描下方企业微信二维码

image
image

Related Articles

联系我们 预约演示
小墨 AI