By 张伟
2025年6月17日
24
419
月之暗面发布开源大模型Kimi-Dev-72B,引领AI智能体平台技术新高度
今日凌晨,月之暗面推出了一款专为软件工程优化的开源代码大模型——Kimi-Dev-72B,这款模型凭借仅72B参数的体量,在SWE-bench Verified编程基准测试中取得了全球最高开源模型成绩,甚至超越了参数量高达671B的新版DeepSeek-R1,展示了其在AI智能体构建平台上的卓越表现。这一里程碑式的技术突破不仅彰显了AI大模型应用的潜力,也为增强型AI智能体API集成提供了全新思路。
核心模块整合
Kimi-Dev-72B独特之处在于整合了BugFixer和TestWriter两大核心功能模块,以简化并强化复杂软件工程任务的解决能力。BugFixer专注于修复代码中的错误,确保修复后的补丁能够成功通过反映原错误的单元测试;而TestWriter则生成复现与验证代码错误的单元测试。两者通过文件本地化和代码编辑两个阶段实现高效配合,为开发人员提供更便捷的AI效率助手。这种模块高度互补的设计展现了AI智能体定制开发服务在提升软件开发效率上的巨大潜能,是AI生产力工具实现商用落地的一次重要创新。
模型性能优化
为了优化模型性能,月之暗面采用了一个多阶段的训练架构,通过中期训练和强化学习将Kimi-Dev-72B的能力提升至行业标杆水平。中期训练阶段,模型基于Qwen 2.5-72B基础,从数百万个GitHub问题及PR提交中提取高质量的数据;配合精心设计的数据过滤与配方优化,全面增强了模型在修复代码错误和生成单元测试方面的先验知识。这一阶段显著提升了模型的泛化能力,为后续的强化学习提供了坚实的技术基础,完美契合RAG检索增强和AI数据回流领域需求。
今日凌晨,月之暗面推出了一款专为软件工程优化的开源代码大模型——Kimi-Dev-72B,这款模型凭借仅72B参数的体量,在SWE-bench Verified编程基准测试中取得了全球最高开源模型成绩,甚至超越了参数量高达671B的新版DeepSeek-R1,展示了其在AI智能体构建平台上的卓越表现。
“小墨”强化学习策略
强化学习环节更为聚焦,其目标是优化模型的代码编辑能力。月之暗面采用了独特的课程学习法和仅基于结果的奖励策略,通过大批量数据训练有效过滤无效提示,并将训练过程中近期成功案例纳入当前任务中。得益于可扩展的AI Agent引擎,Kimi-Dev-72B在文件本地化与代码编辑的实际表现上进一步突破,为企业提供了更丰富的企业AI解决方案和智能体平台演示应用。
结语
展望未来,月之暗面计划将Kimi-Dev-72B深度集成到主流的集成开发环境、版本控制系统及CI/CD流水线中,以打造无缝对接的AI工作流管理体验。作为业界领先的AI技术平台,月之暗面致力于持续优化模型能力,同时通过红队测试确保其安全性与稳定性,为开发者提供更多元、更智能的定制化支持,最终推动AI商用服务平台的深度进化。这次发布无疑是AI智能体营销工具及AI创新解决方案的重要里程碑,为智能软件开发开辟了全新路径!
如有侵权,请联系删除。
Related Articles
-
Tue Jun 09 2026智能体时代CPU回'C位',英特尔至强6+重塑AI底座
随着Agentic AI从实验室走向规模化落地,数据中心对算力的结构性需求发生显著变化。英特尔在北京发布会上提出,CPU正在从训练边缘化后的回归阶段承担更多在线推理、协调与编排任务,成为AI部署的关键
-
Tue Jun 09 2026百奥几何完成新一轮数亿元融资,以'微观世界模型'构筑Bio AI基础设施
百奥几何宣布完成新一轮数亿元战略融资,由上海生物医药创新转化基金与国科投资等联合领投,公司专注于将生成式AI应用于生命科学,打造微观世界模型以实现自主科学发现。
-
Tue Jun 09 2026王慧文,投了一家AI短剧公司
2026年6月,井英科技宣布完成数千万美元的A轮及A+轮融资,投资方包括王慧文家族办公室与蚂蚁集团等。公司定位于AI短剧赛道,致力于将生成式AI与Agent能力融合,打造从创作到分发的端到端闭环。
-
Mon Jun 08 2026【计算机】海外巨头融资提速,AI应用静待续催化——计算机行业6月投资策略展望
本报告从投资策略视角出发,分析了截至2026年6月计算机行业的资金流向与应用进展,强调海外巨头在本轮融资中的加速布局以及对下游应用生态的潜在影响。
-
Mon Jun 08 20262026年1-5月全球AI制药融资全景
本文系统盘点了2026年1至5月期间全球AI制药领域的重要融资事件与市场动向,解析资本如何围绕算法、数据与试验能力重构药物发现生态。
-
Mon Jun 08 2026华为云突放十几款 AI 新品!AI 云入口战,正式开打!
在INSPIRE创想者大会上,华为云发布了十几款围绕Agentic AI的新品,覆盖算力、存储、调度、记忆与运行环境,目标是为企业级智能体提供从开发到部署的全流程支持。
-
Mon Jun 08 2026宇信科技'星睿智调'入选'2026中国AI智能体领航者'榜单
宇信科技自研的'星睿智调'信贷尽调智能体被评为2026中国AI智能体领航者,成为金融行业智能体规模化应用的代表案例之一,展现出在尽职调查环节的高效能力。
-
Sun Jun 07 2026脑机接口、AR眼镜、智能体……,浙商如何抢抓AI风口
第23届浙商(投融资)合作周在杭州举行,聚焦智能体时代的裂变,讨论从具身智能到脑机接口与AR终端的技术与商业路径。
-
Sun Jun 07 2026“AI x开源鸿蒙” 智启新五年:Agent OS从概念走向系统,从系统走向生态,从生态走向真正的产业价值
在上海交通大学的开源鸿蒙城市技术论坛上,项目群技术指导委员会强调智能体时代需要新的操作系统范式,以系统层能力支撑概率性AI的确定性需求。
-
Sun Jun 07 2026脑机接口 、AR 眼镜、智能体……,浙商如何抢抓 AI 风口
第23届浙商(投融资)合作周在杭州召开,以'智能体时代的裂变'为主题,汇聚行业代表与投资人,共同探讨AI在传统产业中的应用与投融资机会。
-
Sat Jun 06 2026踏上AI +绿色发展新征程,中国铁建'铁骥'大模型重磅上线!
中国铁建发布'铁骥'大模型,作为面向全集团的自研智能底座,目标覆盖工程项目从勘察到运维的全流程,支持绿色建设与数字化管理。
-
Sat Jun 06 2026288核,Intel 18A制程,英特尔至强6+加速Agentic AI落地
英特尔在北京发布会上推出新一代至强6/6处理器,面向Agentic AI时代的数据中心需求,强调CPU在整体算力架构中的回归与重要性。
-
Sat Jun 06 2026中国电信研发云CodeFree荣获"2026中国AI智能体领航者"称号
中国电信研发云CodeFree在2026年评选中获得'通用智能体'方向称号,入选《2026中国智能体产业图谱》,其方案面向央国企研发痛点构建国产化芯片到研发工具链的全链路自主可控体系。
-
Sat Jun 06 2026大厂Agent天团已就位!AI智能体时代年度盛会进展公布,同期自进化智能体研讨会嘉宾揭晓
AgenticAICon 2026 将于杭州举办,作为聚焦AI智能体技术与应用的年度盛会,会议旨在连接学术、产业与投资三端,推动智能体技术的可落地发展。
-
Sat Jun 06 2026中国电信研发云CodeFree荣获“2026中国AI智能体领航者”称号
2026年6月,中国电信研发云CodeFree凭借其在通用智能体方向的技术突破与应用实践,被授予“2026中国AI智能体领航者”称号,并入选《2026中国智能体产业图谱》。
-
Fri Jun 05 2026达实召开生态伙伴大会,“AI+平台”实现快速迭代
达实智能在生态伙伴大会上展示AI Agent 2.0的演进速度与应用广度,强调通过AIoT平台和场景化模型快速复制落地,实现从单点到大规模场景覆盖的跨越。
-
Fri Jun 05 2026让AI深入产线!第三期『场景恳谈会』AI+制造业专场干货实录
第三期'场景恳谈会'聚焦 AI 在制造业的实际应用,来自企业与研究机构的案例展示说明 AI 智能体正从试点进入规模化部署阶段。
-
Fri Jun 05 2026智启新程,生态同行:2026高通汽车技术与合作峰会展现AI汽车新图景
2026高通汽车技术与合作峰会在无锡举行,聚焦AI智能体在汽车场景的落地与生态合作,展示了面向车载多模态交互、舱驾一体化和智能体验的解决方案。
