By 张伟
2025年1月9日
24
419
OpenAI最强推理模型o3发布
OpenAI发布了最强推理模型o3,标志着大型语言模型开发新时代的到来。12月21日,OpenAI在其连续12日圣诞发布活动中推出了o3,这款升级版推理模型被认为在某些情况下接近通用人工智能。OpenAI CEO Sam Altman表示,o3代表了AI技术的新阶段,可用于执行日益复杂的AI解决方案和AI企业解决方案。
创新能力
从o1到o3,OpenAI见证了推理模型的发展。o3在逻辑推理和思维链分析方面进行了显著改进,并提供了不同推理时间模式以优化效果。即将推出的mini版在特定任务上进行了微调,计划于1月底亮相,然后不久会发布o3的完整版。这一策略展示了OpenAI在AI系统开发上的创新能力。
突出的推理能力
在ARC-AGI基准测试中,o3的推理能力表现突出,高设置下的得分达到87.5%,远超o1。即便在低推理能力下,o3的表现也是o1的三倍。在这些测试中,o3的表现远超其他竞争产品,这是ChatGPT开发和Langchain框架在AI推理中获得成功的例证。
OpenAI明年将与ARC-AGI背后的基金会合作构建其下一个基准测试。
“智东西”技术深耕
值得注意的是,目前o3的成本较高,每项传统任务的解决费用约为5美元,而o3在低推理模式下每个任务需花费17至20美元。随着未来与ARC-AGI基金会的合作,OpenAI将继续在基准测试中深耕技术,为用户提供更高效的AI定制开发解决方案。
结语
综上所述,o3的推出不仅展示了OpenAI在AI定制化开发领域的卓越,也为产业各界提供了参考。通过优化ChatGPT在企业中的应用和如何利用AI提升企业效率,这款新模型将为教育行业AI解决方案、税务AI咨询等领域带来重大的技术突破。
如有侵权,请联系删除。
Related Articles
-
Wed Apr 29 2026知鸟CTO沈菁出任金融Agent论坛出品人:聚焦实时风控、智能投顾与合规客服落地案例
知鸟CTO沈菁担任金融Agent论坛出品人,论坛聚焦金融场景Agent的实践落地,重点涵盖实时风控、智能投顾与合规客服三大方向,并邀请多家金融机构分享案例。
-
Wed Apr 29 2026IDC首发金融行业生成式AI市场全景图谱:中国市场规模将突破445亿元
国际数据公司(IDC)发布《中国金融行业生成式AI市场概览,1H2026》,首次对金融行业生成式AI全生态进行可视化呈现,揭示了市场规模、应用场景与竞争格局的最新变化。
-
Tue Apr 28 2026Agent大规模落地元年,企业级开发工具链如何选型?陈迪豪领衔解读MCP、A2A与三大编排框架
2026年被视为Agent大规模落地的元年,企业面临如何在多种协议与编排框架中选型以构建可监控、可回滚的Agent平台;文章由实践专家提供实战级建议。
-
Tue Apr 28 2026【新闻资讯】智能体AI初创公司Fortytwo Maru与韩陆军后勤司令部合作开展AI转型(AX)项目
2026 年 4 月 24 日,Fortytwo Maru 与韩国陆军后勤司令部签署多方合作备忘录,计划在国防后勤领域推进 AI 转型(AX),构建长期协作機制與项目框架。
-
Tue Apr 28 2026艺赛旗出席2026 WBCIO数智创新大会:AI驱动下的企业生产力重构与组织跃迁
艺赛旗在2026 WBCIO数智创新大会上深入探讨了AI智能体从能力到价值落地的路径,提出企业级AI Agent需与RPA深度融合以实现确定性、可审计的业务执行。
-
Tue Apr 28 2026启明创投投资企业要闻十条 Vol.15, 2026.4.28
本期要闻汇总了启明创投在2026年4月28日关注并披露的多起企业动态,涵盖从自动驾驶、智能驾驶底座模型到生物医药智能体驱动的新进展,体现了AI技术与产业应用深度融合的趋势。
-
Tue Apr 28 2026AI 通信融合与边缘智能体成功召开
在2026全球6G技术与产业生态大会上,AI通信融合与边缘智能体研讨会成功举办,聚焦AI与6G网络的耦合设计与边缘智能体在分布式场景中的协同能力。
-
Tue Apr 28 2026艺赛旗出席2026 WBCIO数智创新大会:AI驱动下的企业生产力重构与组织跃迁
在2026 WBCIO数智创新大会上,艺赛旗解决方案部总经理李博围绕AI Agent在企业生产力重构中的实践进行了深度分享,强调Agent并非单一技术,而是认知能力与执行能力结合后的生产力载体。
-
Tue Apr 28 2026深圳AI公司成立仅两个月,完成千万美元种子轮融资!
深圳忆纪元科技(MemoraX AI)宣布完成千万美元种子轮融资,成立时间不到两个月的公司迅速获得市场与资本关注,凸显大模型内生记忆技术在行业内的紧迫需求。公司聚焦构建可嵌入大模型的长期记忆模块,试图
-
Tue Apr 28 2026腾讯云升级全栈企业级Agent能力;支付宝再推“AI收”;谷歌DeepMind将与韩国合作推进“登月”级AI项目
在2026腾讯云城市峰会(重庆站),腾讯云宣布其全栈企业级Agent能力全面升级,面向企业用户首次推出Claw Pro专有云版,并发布ADP智能工作台、Agent Memory、Agent Stora
-
Tue Apr 28 2026中国通信学会网络和数据安全专业委员会联合中国移动发布《中国移动OpenClaw安全配置与防护指南》 共筑AI智能体安全防线
中国通信学会网络和数据安全专业委员会与中国移动联合发布了《中国移动OpenClaw安全配置与防护指南》,这是国内首个针对OpenClaw智能体的标准化安全规范,覆盖安装、配置、运维与应急全流程。
-
Tue Apr 28 2026NVIDIA 与合作伙伴齐聚汉诺威工业博览会 2026,展示 AI 驱动制造的新图景
在2026年汉诺威工业博览会上,NVIDIA及其合作伙伴集中展示了面向制造业的AI解决方案,凸显AI在工业设计、仿真和现场生产中的应用价值。
-
Tue Apr 28 2026斯坦福HAI最新报告出炉:中国模型追平美国,95%企业AI投资零回报
斯坦福大学以人为本人工智能研究所(HAI)发布《2026年AI指数报告》,综述了全球AI研发、投资与应用的最新态势,并对中美两国在模型、投入与产出上进行了细致比较。
-
Mon Apr 27 2026一者科技携AI Agent翻译技术创新成果出席2026中国翻译协会年会,驱动翻译行业融合破圈
在2026中国翻译协会年会上,一者科技展示了其AI Agent驱动的翻译技术与本地化解决方案,并参与组织与发起多项行业讨论。
-
Mon Apr 27 2026中国汽研发布整车气动性能预测AI智能体,助力行业研发提速
中国汽车工程研究院发布的整车气动性能预测AI智能体,将风阻与风噪两大核心模块整合,能在分钟级完成传统数小时或数天才能得到的仿真结果,显著提升整车空气动力学研发效率。
-
Mon Apr 27 2026上海交大:200页蓝皮书揭露'真AI'还是'假AI'?
上海交通大学发布的《人工智能行业发展蓝皮书》以详实数据分析AI产业演进,提出AI-Native三代框架与L0-L5成熟度分级,帮助判断产品是'真AI'还是只是'AI装饰'。
-
Mon Apr 27 2026RSAC 2026:AI SOC从'辅助驾驶'迈入'智能体驱动'时代
在RSAC 2026上,多家安全厂商展示了从Copilot式建议工具向具备执行权限的Agent演进的AI SOC解决方案,能够独立完成检测、调查到自动修复的完整闭环。
-
Mon Apr 27 2026AI 应用行业月报:原生 AI 全面领跑,教育赛道增长爆发
本期月报聚焦2026年3月国内AI应用市场,分析原生独立AI与In-App AI的并行发展态势,及教育赛道的强劲增长表现。
