端侧微调与本地智能体在实际设备上的应用场景图

2026年3月19日

42

637

本地智能体与端侧微调(2026.03.19)

2026年3月,本地智能体、端侧微调与分布式推理基础设施的进展显著,硬件与软件协同推动了从云端向端侧的计算迁移。

NVIDIA 与本地智能体硬件演进

NVIDIA 发布包括 DGX Spark 与 RTX PCs 在内的 'agent computers' 硬件类别,并在其平台上部署 Nemotron 3 Super (120B) 与 Nano (4B) 等模型,旨在提升本地推理与训练能力。

消费级微调框架与工具链

Tether 推出的 BitNet LoRA 框架使消费级设备可进行高效微调,降低微调门槛;同时 Picsart 等公司推出智能体市场,扩展模型与插件生态。

本地智能体的竞争将从参数规模转向场景落地与系统协同能力。

“小墨”

企业级 SOC 与行业投入

Qevlar AI 获融资用于自主 SOC 平台研发,企业级解决方案开始向端侧与本地智能体倾斜,配合硬件加速实现低延迟部署。

安全与身份风险管理

Okta 提出基于 LLM 的身份风险评分方法以应对智能体身份问题,Dell 更新 AI Factory 基础设施以支持规模化训练与部署,Anthropic 等公司发展 B2B 应用市场,形成软硬结合的端侧生态。另外,Apple 的 MacBook Neo 等 AI 硬件新品也推动消费端智能体应用普及。

如有侵权,请联系删除。

Related Articles

联系我们 预约演示
小墨 AI