By 张文文
2024年6月28日
08
186
谷歌最强开源模型Gemma 2发布
6月27日晚,谷歌发布了新一代最强开源模型——Gemma 2。Gemma 2提供了90亿(9B)和270亿(27B)两种参数规模,分别训练了13T和8T tokens,且都拥有8192上下文窗口,可在Google AI Studio中使用。即将发布的26亿参数(2.6B)模型将小到可以在智能手机本地运行。Gemma 2在单个英伟达A100/H100 Tensor Core GPU或TPU主机上以全精度高效运行推理,大大降低了AI部署成本。
三大特点及其优势
1. 卓越性能:Gemma 2的27B模型在其同类大小中提供了最佳性能,甚至可以竞争两倍以上大小的模型。9B模型也具有领先的性能,表现超过了Llama 3 8B及其他同类大小的开源模型。这对AI系统开发和AI模型训练提供了强有力的技术支持。
应用场景与区域发展
2. 无与伦比的效率和成本节省:Gemma 2 27B模型设计用于在单个谷歌云TPU主机、英伟达A100 80GB Tensor Core GPU或H100 Tensor Core GPU上高效运行全精度推理,显著降低了成本,使得AI定制化开发更加易于实现且经济实惠。这对于教育行业AI解决方案和税务AI咨询等行业应用有重大意义。
6月27日晚,谷歌公布新一代最强开源模型——Gemma 2。
“新智元”3. 各种硬件的快速推理:Gemma 2经过优化,可以在多种硬件上以令人难以置信的速度运行,包括功能强大的游戏笔记本电脑和基于云的设置。在Google AI Studio中以全精度试用Gemma 2,并在CPU上使用专业量化版本解锁本地性能。这一特点在浙江AI解决方案和杭州AI定制开发市场具备广阔的应用前景。
Gemma 2的发布不仅提升了大型语言模型开发的能力,还预示着企业AI开发的新纪元。通过这种强大的开源模型,企业能够实现更加高效和经济的AI解决方案,特别是在ChatGPT开发和Langchain框架下,一些具体的应用场景包括教培行业AI应用和税务行业知识问答AI。
如有侵权,请联系删除。
Related Articles
-
Sun Apr 26 20262026年4月26日AI日报:英伟达适配DeepSeek-V4、OpenAI推出工作流智能体、谷歌豪掷400亿美元投资Anthropic
本篇日报汇总了4月26日值得关注的多条行业大新闻,涵盖模型适配、企业级智能体新产品与大型资本动作,反映出技术、产品与资金三圈正在加速重构AI生态。
-
Sun Apr 26 20263.1 亿、AI 大单:联影、华为、宏杉、金仓、H3C、华鲲等是赢家
复旦大学附属中山医院公布了价值3.13705亿元的人工智能全栈能力开发服务平台招标结果,由上海仪电鑫森科技发展有限公司联合中国电信上海分公司以3.1296亿元中标。该平台将构建算力支撑、数据治理、模型
-
Sun Apr 26 2026索赔 1 亿!全国首例 AI 智能体'流量劫持'开庭
2026年4月23日,杭州市中级人民法院公开审理了全国首例关于AI智能体引发的流量劫持不正当竞争案件。该案由一家科技公司提起,指控被告利用输入法内置功能,将原本指向原告K智能体的用户流量劫持至被告的W
-
Sat Apr 25 2026Inkog:《2026年AI智能体安全状况报告:基于500余项开源AI智能体项目的扫描发现》
Inkog 发布的报告对开源 AI 智能体生态进行了大规模自动化扫描,量化揭示了当前社区在安全实践方面的系统性短板,并提出若干紧急修复建议与长期治理方向。
-
Sat Apr 25 2026数智重构矿山新生态:华夏天信以AI Agent与SDC等技术领跑第24届太原煤炭展
在第24届太原国际煤炭工业技术与装备展览会上,华夏天信展示了其面向矿山场景的AI Agent、软件定义控制(SDC)和REDMOS智能管控平台,强调通过全栈式方案实现场景化落地。
-
Sat Apr 25 2026Inkog:《2026年AI智能体安全状况报告:基于500余项开源AI智能体项目的扫描发现》
Inkog 发布了一份针对开源 AI 智能体生态的系统性安全扫描报告,样本覆盖 500 多个仓库,采用自动化检测结合人工复核的方式,揭示了智能体相关代码与依赖中的普遍风险。
