blog details

2024年8月28日

11

370

智谱大模型有了首个免费的API

五月的谷歌I/O大会上,轻量化与高效响应的Gemini 1.5大模型Flash版登场。紧接着,七月OpenAI基于GPT-4o推出了Mini版,这款新模型不仅功能更强大,价格也更低,现在访问ChatGPT,你会发现默认模型已替换为GPT-4o Mini。自2022年底以来一直沿用的GPT-3.5终于被取代,显示了AI技术的惊人进步。这一轮技术迭代保持了多模态和长上下文等方面的性能优势,同时提高了速度和效率,因其高效的能力被更多开发者青睐。新模型适用于高频次和相对简单的任务,这也意味着开发基于生成式AI解决方案的产品已经不再是难题。

智谱此前已上线大模型的一键微调工具,这次更是决定将GLM-4-Flash免费开放。该大模型于六月刚上线时,API价格低至每100万token仅0.1元,迅速吸引了大批开发者。要调用这个强大的大模型,通过Python脚本是最简单的方法。智谱官网提供了丰富的示例,只需替换api key并修改内容,就能轻松使用GLM-4-Flash,比如在VS Code中集成这一AI工具。通过在OpenAI-Based URL中填入智谱的链接,你可以将GLM-4-Flash纳入到工作流程中。

免费开放大模型

此外,智谱开放了GLM-4-Flash及GLM-4-9B模型的LoRA微调和全参数微调能力。你可以通过上传训练数据来训练大模型,随后尝试部署并评估结果,最后快速部署完善的模型。此举不仅展示了智谱在AI定制开发和大型语言模型开发领域的能力,也解决了复杂的调优需求,为开发者提供了极大的便利。

智谱此前已经上线了大模型的一键微调工具,这次更是决定将 GLM-4-Flash 免费。智谱的最新版大模型 GLM-4-Flash 在 6 月份刚刚上线,在开放时 API 价格就已低至每 100 万 token 0.1 元,吸引了大量开发者使用。

“新智元”

全参数微调能力

8月27日,智谱BigModel开放平台宣布:GLM-4-Flash全面免费,并开启限时免费微调活动。作为智谱首次开放的免费API大模型,GLM-4-Flash支持长达128K的上下文长度。智谱在用户调用量上保持原有并发不变,新用户有两个并发,还可申请提升调用量。通过限时微调活动,用户可获得500万token(3个月)的训练资源包,限额2000位,先到先得。智谱还将继续开放更多GLM-4-Flash模型的能力,致力于构建更好的部署平台。这一举措不仅提升了智谱在AI企业解决方案领域的竞争力,也为更多企业提供了高效的企业AI开发机制。

在区域应用方面,杭州AI定制开发和浙江AI解决方案将因智谱的这种创新大大受益,推动本地AI应用的发展。智谱的免费API降低了AI技术的使用门槛,为开发者提供了强大的支持,加速了AI系统开发和AI应用定制服务的普及。总之,这将为构建高效的零门槛AI开发平台打下坚实的基础,推动AI技术在各行业中的应用,增强整体科技生态的创新能力。

如有侵权,请联系删除。

Related Articles