面向肺癌的 AI 评测与临床场景结合示意

2025年12月29日

64

598

AI医生终于有了硬标尺!全球首个专病循证评测框架GAPS发布,蚂蚁联合北大王俊院士团队出品

蚂蚁健康联合北大王俊团队推出 GAPS 框架,这是面向专病的循证评测体系,首批聚焦肺癌领域,旨在提升医学大模型的临床适用性与安全性。

从答题测评到临床循证

传统评测多以问答式任务衡量模型能力,GAPS 强调结合临床真实场景、自动化评估链与证据驱动的方法,使评测更贴近实际临床决策需求。

框架特色与方法论

GAPS 包括明确的任务定义、证据追溯机制和量化指标,支持在专科病种中衡量模型的诊断、建议与风险控制能力,提升评估的可重复性与可信度。

GAPS 把评测拉回到临床场景与证据链,帮助判定模型在真实病种中的可用性和风险。

“小墨”

助力医疗智能体落地

该框架有助于医疗机构和监管方建立统一标准,推动医疗智能体从实验室验证走向临床应用,同时降低部署风险与不确定性。

未来挑战

要实现广泛应用,仍需更多多中心临床数据验证、伦理和隐私保护机制以及产业化工具链支持,行业方需协同推进标准化与监管框架的建设。所有后续段落的合并内容

如有侵权,请联系删除。

体验企业级AI服务

联系产品经理,扫描下方企业微信二维码

image
image

Related Articles

联系我们 预约演示
小墨 AI