ollama v0.20.0 发布：Gemma 4 全家桶来了，音频、视觉、MoE 能力全面升级

2026年4月4日

592

ollama v0.20.0 发布：Gemma 4 全家桶来了，音频、视觉、MoE 能力全面升级

2026年4月3日，Ollama 正式发布了 v0.20.0 版本。这次更新是近年来幅度最大的一次集中增强，不仅带来了 Google 最新的 Gemma 4 系列模型全规格支持，更在音频处理、Tokenizer 优化、MoE 架构修复等多个底层方向进行了系统性升级。对于关注本地大模型部署和开源工具链的开发者而言，这一版本值得关注。

Gemma 4 全系列正式支持

本次更新的核心可以概括为两个关键词：Gemma 4 全面支持、音频与推理能力升级。Gemma 4 作为 Google 最新的开源大模型系列，提供了从轻量到大规模的多规格选择，而 Ollama 这次实现了完整的适配支持。同时，音频方向的增强尤为亮眼，从输入到转写、从命令行到 API 接口，形成了一套完整的音频处理能力矩阵。

音频能力全面增强

v0.20.0 最重要的变化是 Gemma 4 相关支持的加入。Ollama 提供了四种可直接运行的模型规格： • Effective 2B（E2B）：适合轻量场景，资源消耗低 • Effective 4B（E4B）：在能力和资源消耗之间做了更平衡的选择 • 26B MoE：混合专家模型，包含 4B 活跃参数 • 31B Dense：大规模稠密模型，适合高性能场景从规格覆盖来看，Gemma 4 已经形成了完整的轻量到大型模型矩阵，用户可以按具体场景和硬件资源灵活选择。同时，Gemma 4 的 GGML 模型支持也已加入，转换器也针对新的 weight drop 命名进行了更新，确保模型导入流程顺畅。

Gemma 4 的加入让 Ollama 的模型生态更加完整，音频能力的系统化增强更是补齐了多模态应用的关键一环。

“AI技术观察者”

Tokenizer 与推理优化

这次更新在音频方向的变化非常密集，堪称重点之一。Gemma 4 新增了音频支持，采用 USM conformer encoder 作为音频编码器。更关键的是，OpenAI 音频 API 支持已经加入，并配套了 capability detection 能力检测机制。命令行层面也进行了重要更新：run 命令现在支持音频输入；新增了专门的转写命令 `ollama transcribe MODEL`，对于音频转文字场景非常实用；同时还增加了 OpenAI 音频转写 API 和 input_audio 支持。音频输入方式也被简化为 dropped file attachments，使用体验更直接。从输入到转写、从 API 到命令行体验，v0.20.0 在音频方向完成了一整套能力补强。

MoE 架构与测试增强

Tokenizer 层面新增了 SentencePiece-style BPE 支持，这对于模型适配和分词处理非常重要，可以显著提升不同模型格式与分词规则的兼容性。Pipeline 中也修复了 add_bos_token 设置问题，使 Tokenizer 行为更贴合配置。渲染器方面进行了重写，确保与 HuggingFace Jinja2 模板完全一致，这意味着模型输入模板行为会更加标准化，减少因模板差异导致的结果偏差。同时修复了 BOS token 输出问题。 Gemma 4 的 26B 版本是 MoE 模型，因此 MoE 相关改动尤为关键：为 MoE router 增加了 per_expert_scale 并修复了 moe_intermediate 问题；修复了 MoE fused gate_up split 和 multiline tool-call arg parsing；统一规范了 MoE block 字段对齐格式。缓存机制也进行了调整，使用 4096 kvcache.NewSWAMemCache 并启用 full SWA memory 以获得更好的缓存复用效果。

如有侵权，请联系删除。

Ollama Gemma 4 开源大模型音频AI MoE架构 LLM 积墨AI AI智能体 AI智能体平台私有化AI智能体平台企业级AI智能体

Share This Post

ollama v0.20.0 发布：Gemma 4 全家桶来了，音频、视觉、MoE 能力全面升级

Gemma 4 全系列正式支持

音频能力全面增强

Tokenizer 与推理优化

MoE 架构与测试增强

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

GEO智领增长，AI Agent重构全域引擎——AI创新营销工作坊圆满举办

《AI智能体（Agent）赋能制造管理提效》

Figure AI 实现每90分钟下线一台人形机器人

GEO智领增长，AI Agent重构全域引擎——AI创新营销工作坊圆满举办

线上】AI基础设施技术测试周

影目科技 印传学：AI+AR智能眼镜 从破圈到发展趋势预判

【行业动态】Figure AI 实现每90分钟下线一台人形机器人

【Gartner报告精选】预测2026；重要战略技术趋势；中国AI算力管理平台；中国市场指南

LightCounting：AI如何重塑光学行业

运营商向Token价值经营转型，持续看好AI产业投资机会

Q1全球VC 3000亿美元AI占八成创纪录；Sarvam AI 3亿美元成印度最大AI融资；特朗普对药品加征100%关税

Q1全球VC 3000亿美元AI占八成创纪录；Sarvam AI 3亿美元成印度最大AI融资

从OpenClaw看透AI Agent产业链

【第66期】医械+AI行业动态●皕晟周报速递（2026.3.27-2026.4.3）

AI-GEO+OPC双赛道红利，4月11日深圳开启

月度路演 2026年4月 “AI x 先进制造”主题，项目&观众报名开启

解锁AI营销新范式，共赴2026首届AI+营销数字转型峰会

小红书、京东、蚂蚁、平安等7位专家复盘AI落地实战，2026奇点智能技术大会「AI+行业落地实践」专题揭晓

【4.17-4.20/成都】智能体（AI Agent）赋能教学创新：理论、工具与智慧课程建设实践研讨班

中国AI，最新趋势来了！

4亿美元收购，万亿独角兽杀入AI制药；瑞盛生物完成收购常州天宁龙洋金铂利口腔门诊部51%股权

Helidon 引入 Agent 能力，Java 框架开始内建 AI 编排

【中泰传媒】康雅雯：AI技术迭代与商业化加速，国产大模型全球化竞争力凸显

英伟达发布《2026年医疗健康与生命科学领域AI应用现状报告》

从豆包AI手机到学而思'小精龙'：AI Agent正在拆开教育的'黑箱'

AI算力'命脉级'硬件，OCS行业爆发前夜，5家A股公司抢先布局

三天实战手把手 AI智能体实操特训

围观巅峰对决！首届“AI智能体+”大赛决赛，邀你共同见证！

Agentic AI Summit深圳大会启动，别只谈Agent理想，来深圳解决Agent落地后的'脏活累活'

政策落地：AI+电商10家核心概念股盘点

从豆包AI手机到学而思“小精龙”：AI Agent正在拆开教育的“黑箱”

全球首个射频大模型 RF‑GPT 发布！AI 终于看懂无线信号，6G 认知革命来了

探索具身智能前沿：信息与智能工程学院专业教师为学生深度解读Agent AI

388万元，AI智能体大单：火山引擎中标

“2026 FORCE LINK AI 创新巡展・武汉站”成功举办！

刷爆全网！2026最火科技：AI Agent不再是概念，人人都能拥有专属'数字员工'

从聊天到行动：2026年AI Agent如何重塑人机协作

41岁程序员靠AI年入4亿美元：普通人如何抓住这波AI红利？

【投融资】2亿视频、2840万美元收入，AI音视频应用Captions更名Mirage，GeneralCatalyst注资7500万美元

从聊天到行动：2026年AI Agent如何重塑人机协作

普华永道：金融机构AI投资回报已达10%-15%，大规模推广AI仍有困难

刷爆全网！2026最火科技：AI Agent不再是概念，人人都能拥有专属'数字员工'

深圳4月AI智能体培训开启：手把手教学！从0-1构建你的第一个Agent，用AI工具变现！

“AI+制造”的范式革命

探索具身智能前沿：信息与智能工程学院专业教师为学生深度解读Agent AI

一夜变天，Anthropic正式封杀OpenClaw！全球开发者24小时血崩

灵伴科技CEO祝铭明：AI 眼镜重构产业生态 余江应以认知更新拥抱智能未来

57k Star霸榜GitHub！字节这款超级智能体，凭何让全球AI圈真香？

灵伴科技CEO祝铭明：AI 眼镜重构产业生态 余江应以认知更新拥抱智能未来

博联率先接入 QClaw，以微信开启全屋智能 AI Agent 新时代

博联率先接入 QClaw，以微信开启全屋智能 AI Agent 新时代

AI手术机器人企业磅策医疗完成亿元B轮融资，构筑AI消费医疗新生态

北京大学《OpenClaw001：龙虾使用入门》开启个人 AI Agent 平民化时代

甲子光年：AI原生组织——OpenClaw推动组织形态重塑 2026

南京分院政企数智项目组 AI 系列研讨（四）AI Agent 技术体系深度解析

智能体全面开花，产业链做好落地准备了吗？AI Agent专场沙龙全链路洞察清智资本、华为、MiniMax……

多模态开放模型、AI 驱动内核优化与 Agent 原生支付（2026.04.03）

主权 AI 基建、Agent 基础设施与边缘优先（2026.04.02）

共拓百亿级金融通用智能体市场！阿里云联合百家伙伴吹响冲锋号

字节跳动披露豆包大模型日均 Token 突破 120 万亿/OpenAI 二级市场 6 亿美元股份无人接盘

【企业动态】深擎科技亮相阿里云金融 AI 联盟大会，以证券垂类 AI 能力共拓百亿智能体市场

NexusGen完成新一轮数千万级别融资 ，让AI回归个人掌控

字节跳动披露豆包大模型日均 Token 突破 120 万亿/OpenAI 二级市场 6 亿美元股份无人接盘

合合信息亮相2026金融AI联盟大会，携手阿里云共同启动'超级智能体计划'

智能体全面开花，产业链做好落地准备了吗？AI Agent专场沙龙全链路洞察清智资本、华为、MiniMax……

3月软件大厂激战AI智能体，转型阵痛与高增长并存

【报告】OpenClaw专题二：OpenClaw 深度调研报告-从对话到执行的AI智能体革命（附PDF下载）

【企业动态】深擎科技亮相阿里云金融 AI 联盟大会，以证券垂类 AI 能力共拓百亿智能体市场

他用2万美元和十几个AI工具，做出一家年入18亿美元的公司

171 万、北京地铁《基于 AI 大模型的网络安全态势感知智能体》大单

影目科技印传学：AI+AR智能眼镜从破圈到发展趋势预判

灵伴科技CEO祝铭明：AI 眼镜重构产业生态余江应以认知更新拥抱智能未来

灵伴科技CEO祝铭明：AI 眼镜重构产业生态余江应以认知更新拥抱智能未来

NexusGen完成新一轮数千万级别融资，让AI回归个人掌控

AI Agent 落地实务全拆解解锁商科智能新玩法

五方六力赋能京苏双向奔赴