By 小墨
2025年8月21日
32
852
字节开源最新大模型Seed-OSS-36B,超越Qwen
字节公司的Seed团队刚刚发布了首个开源大型语言模型——Seed-OSS-36B。这一模型不仅支持512K的长上下文,还在推理及智能体任务中表现出色,特别是对国际化场景进行了优化。
Seed-OSS-36B的核心特性
Seed-OSS-36B模型具备灵活的思考预算控制功能,这使得用户可以根据实际需求动态调整推理长度,大幅提高推理效率。此外,该模型的推理能力被特别优化,适用于多种通用任务。
技术亮点与开源策略
模型采用了最新的RoPE和GQA注意力机制,并使用RMSNorm以及SwiGLU激活函数,已获得Apache-2.0商用许可,兼具研究友好的设计。
Seed-OSS-36B的灵活推理和智能体任务能力为开发者提供了极大的便利。
“小墨”灵活的推理预算与长上下文
Seed-OSS-36B允许用户设置思考预算,可以优化推理过程。例如,当思考预算为512时,模型会根据消耗的预算自我反思并调整推理策略,以便在复杂问题中确保更好的表现。
与其他模型的比较
Seed-OSS-36B在多项基准测试中超越了Qwen系列,并证明了其出色的智能体能力和研究友好性。未来,Seed-OSS可能将引领更多开源AI模型的发展,推动整个行业的进步。
如有侵权,请联系删除。
Related Articles
-
Fri Apr 17 2026湖北省智能体公共服务平台启动建设 AI产业有了'公共底座'!
在2026年湖北人工智能产业发展生态大会上,湖北省智能体公共服务平台正式启动建设,目标是解决企业算力成本高、场景落地慢等痛点。
-
Fri Apr 17 2026OpenClaw龙虾、Token词元与大模型、智能体、AI发展新范式全景解析,年度AI大会终极议程公布
2026中国生成式AI大会(北京站)将于4月21-22日举办,主题为“奔赴AGI 重塑未来”,旨在汇聚学界与产业界力量,探讨生成式AI与智能体发展的新范式。
-
Fri Apr 17 2026Pharma.AI 2026春季发布会:驱动制药超级智能未来
英矽智能于4月14日举办Pharma.AI 2026春季发布会,展示在制药领域的最新AI能力与产品模块升级,强调构建决策驱动的AI生态系统。
-
Fri Apr 17 2026深信服受邀分享AI智能体安全治理'新解法'
在2026年世界互联网大会亚太峰会上,深信服副总裁杜智伟提出面向AI智能体的安全治理新范式,强调从内容合规向行为可控转型。
-
Fri Apr 17 2026AI生成内容暴增14倍 重塑网络视听生产体系
《中国网络视听发展研究报告(2026)》显示,我国网络视听用户规模与市场规模持续扩大,AI生成内容数量激增,正在改变内容生产与传播格局。
-
Fri Apr 17 2026深信服受邀分享AI智能体安全治理'新解法'
在2026年世界互联网大会亚太峰会上,深信服副总裁杜智伟就AI智能体安全治理发表演讲,强调应从传统的内容合规向行为可控的治理范式转型,以应对新一代数字员工类智能体带来的复杂风险。
