blog details

2025年6月18日

24

419

谷歌重磅发布Gemini 2.5系列模型,AI推理性能再创佳绩

今日凌晨,谷歌正式宣布对其Gemini 2.5系列模型进行全系升级,包括推出Gemini 2.5 Pro和Gemini 2.5 Flash正式版,以及发布Gemini 2.5 Flash-Lite预览版。这一更新意味着,Gemini 2.5 Pro和Flash已从实验阶段进入稳定版,可面向企业级AI应用投入使用。作为重磅新成员的Flash-Lite模型展现了其在编程、数学、科学推理及多模态基准测试领域的卓越表现,通过性能提升和延迟优化,全面超越2.0系列模型。同时,Flash-Lite凭借更快的推理速度和高性价比,成为AI行业应用中的新兴亮点,为各类开发场景提供了更多可能。

根据LMArena排行榜数据,Gemini 2.5 Flash-Lite以较优异的成绩跻身全球AI模型文本能力排名第12位,其中创意写作排名第三,编程排名第14,难题提示排名第17。而在性价比对比图表中,Gemini 2.5 Pro的性能提升幅度较Gemini 1.5 Pro高出120分,已稳居谷歌迄今最出色的AI生产模型之列,高于OpenAI、Anthropic等其他主流大语言模型。这不仅体现了大语言模型应用在技术优化和使用成本控制上的进一步突破,也为企业AI解决方案提供了强有力的支持。

大语言模型应用在技术优化和使用成本控制上的进一步突破

值得注意的是,价格体系是谷歌在这一更新中的重要亮点之一。Gemini 2.5 Flash-Lite的价格相较Flash版本优惠30%-60%,其中输入费用仅为0.1美元/百万tokens,输出价格为0.4美元/百万tokens。而Gemini 2.5 Flash稳定版,考虑到其强大的推理性能,输入费用设为0.3美元/百万tokens,输出费用为2.5美元/百万tokens。这种灵活且高性价比的设置,全面降低了企业进行AI智能体模型训练和私有化部署的成本,进一步推动了AI商用服务平台的普及。

今日凌晨,谷歌正式宣布对其Gemini 2.5系列模型进行全系升级,包括推出Gemini 2.5 Pro和Gemini 2.5 Flash正式版,以及发布Gemini 2.5 Flash-Lite预览版。

“小墨”

价格体系

Gemini 2.5系列模型还引入了全新的推理机制,允许开发者控制模型的思考预算,即模型在生成响应前进行思考的时间和深度。这种功能在AI智能体开发平台中尤为重要,为AI知识库和私域销售智能助手等应用场景提供了更专业的语义处理能力。此外,谷歌还在其AI Studio、Vertex AI及Gemini应用平台中上线了Flash-Lite预览版,并引入了定制版以增强谷歌搜索功能,全面打通AI场景应用生态。

全新的Gemini 2.5系列不仅符合当前多模态AI能力和AI生产力工具的市场需求,也为开发者在利用AI行业应用提升效率、降低成本方面提供了更多支持。未来,随着谷歌对Gemini模型的持续优化和深度整合,这一系列模型在AI智能体构建与创新解决方案领域的影响力将进一步放大。

如有侵权,请联系删除。

Related Articles

联系我们预约演示
小墨 AI