蚂蚁集团推出安诊儿医疗大模型:正式开源并登顶权威医疗榜单

2026-01-05 15:25
142
近日,蚂蚁集团联合浙江省卫生健康委正式开源其自研的蚂蚁·安诊儿医疗大模型(AntAngelMed)。
该模型基于蚂蚁百灵大模型的高效混合专家(MoE)架构,结合真实、全面的医疗数据深度训练而成,是迄今为止参数规模最大的开源医疗模型(100B总参数)。
用户价值:领先的医学能力
AntAngelMed已在OpenAI发起的HealthBench和国家人工智能应用中试基地(医疗)的MedAIBench等评测基准中表现出色,树立了开源AI医疗模型「高效、专业、安全」的新标杆。
在由OpenAI主导、全球262名医生参与构建的HealthBench评测中,AntAngelMed在HealthBench上的评分达到开源模型第一,超过DeepSeek-R1、Qwen3、OpenAI GPT-OSS等模型,并且在极具挑战性的HealthBench-Hard子集上展现出尤为显著的优势,充分证明了其在真实、复杂医疗环境中的可靠性与专业性。

在由国家人工智能应用中试基地(医疗)·浙江联合中国医学科学院北京协和医学院、中国信息通信研究院三方共建的权威测评体系MedAIBench中,AntAngelMed同样展现出强大的综合专业性与安全性,在医疗知识问答、医疗伦理安全等多个核心维度表现突出。

这种「通用智能+医疗专长」的全栈能力闭环,标志着开源AI医疗模型进入了「高效、专业、安全」三者兼顾的新阶段,为AI技术在医疗领域的应用树立了新的标杆。
对于面向中文医疗场景医疗大模型评测体系MedBench(36个自主评测集,覆盖约70万条样本),AntAngelMed位列评测榜单第一,在医学知识问答、医学语言理解、医学语言生成、复杂医学推理、医疗安全与伦理五大核心维度也都表现出领先水平,体现出AntAngelMed医疗大模型的专业性、安全性与临床适用性。
AntAngelMed在MedBench上排名评测榜单第一
技术解析:三阶段专业训练
AntAngelMed卓越的医疗能力源于其专业、精细的三阶段训练流程。
首先,通过持续预训练对通用基座模型Ling-flash-2.0-base注入大规模、高质量的医学语料,构建了深厚的医疗知识底蕴;
随后,在监督微调阶段,通过多源异构的高质量指令数据,一方面强化了模型的通用核心思维链,另一方面针对医患问答、诊断推理等真实医疗场景进行深度适配;
最后,AntAngelMed采用先进的GRPO强化学习算法,并通过双阶段强化学习路径对模型能力进一步优化提升:首先以「推理强化学习」锻造其逻辑推理的核心能力,再以「通用强化学习」打磨其同理心与安全边界意识,最终实现了医疗专业性与人文关怀的高度统一。
0
好文章,需要你的鼓励