Google开源Gemma 4全面解读:31B参数能否撼动开源格局?

2026年4月3日

60

377

Google开源Gemma 4全面解读:31B参数能否撼动开源格局?

2026年4月,Google DeepMind正式发布新一代开源模型Gemma 4,这是Gemma系列自2025年3月以来的首次重大更新。此次更新一口气推出四款模型,参数规模从20亿到310亿不等,全面覆盖从移动端到工作站的各类场景。更重要的是,Google首次将Gemma系列的许可证从自有协议更换为Apache 2.0,这一决策被开源社区视为Google对开源生态诚意的明确表态。

性能提升:代际级别的跨越

Gemma 4系列包含四款型号:31B Dense、26B A4B MoE、E4B和E2B。31B Dense采用全参数激活架构,60层设计,支持256K上下文,在Arena AI开源排行榜中位列第三。26B MoE则是此次发布的亮点,采用128专家、每次激活8+1的稀疏架构,总参数252亿但激活仅38亿,推理速度接近4B模型,质量远超4B水平,排行第六。E4B和E2B是面向端侧的小模型,分别拥有45亿和23亿有效参数,采用Per-Layer Embeddings技术,在部分设备上内存占用可压至1.5GB以下。

核心技术能力

相比上一代Gemma 3 27B,Gemma 4在多个核心指标上实现了质的飞跃。数学推理方面,AIME 2026竞赛测试从20.8%跃升至89.2%;代码能力Codeforces ELO从110提升至2150,LiveCodeBench从29.1%飙升至80.0%,这是进步最大的方向;综合推理GPQA Diamond从42.4%提升至84.3%,MMLU Pro从67.6%提升至85.2%;视觉理解MMMU Pro从49.7%提升至76.9%。特别值得注意的是长上下文能力,MRCR v2 128K从13.5%提升至66.4%,彻底弥补了Gemma系列此前在这一领域的短板。

这是一个重大里程碑。

“Hugging Face联合创始人Clément Delangue”

差异化定位与市场格局

Gemma 4的核心能力体现在四个方面:推理思考能力,四款模型都内置可开关的思考模式,数学、逻辑、多步骤规划类任务效果显著提升;Agent工作流原生支持函数调用和结构化JSON输出,Google同步发布了开源Agent框架ADK;代码生成能力,支持离线写代码,Codeforces ELO 2150已达到可用水平;多模态理解,所有模型支持图片和视频输入(视频最长60秒),图片支持可变分辨率和五档视觉token预算配置,OCR和文档解析是重点场景。

部署生态与社区影响

Gemma 4最大参数为31B,与国内开源模型DeepSeek V4、通义千问Qwen3.5、智谱GLM-5.1等几百亿到上千亿参数的模型相比,参数量的天花板确实是一个限制。但Gemma 4在端侧部署的工程完整度上做得最深:与高通、联发科进行芯片级合作、与Android生态原生打通、Apache 2.0许可证的合规便利,这些都是它的差异化优势。对于移动端场景和端侧AI应用,Gemma 4可能是目前最务实的选择。

如有侵权,请联系删除。

Related Articles

联系我们 预约演示
小墨 AI