蚂蚁集团推出安诊儿医疗大模型：正式开源并登顶权威医疗榜单

2026-01-05 15:25

142

近日，蚂蚁集团联合浙江省卫生健康委正式开源其自研的蚂蚁·安诊儿医疗大模型（AntAngelMed）。

该模型基于蚂蚁百灵大模型的高效混合专家（MoE）架构，结合真实、全面的医疗数据深度训练而成，是迄今为止参数规模最大的开源医疗模型（100B总参数）。

用户价值：领先的医学能力

AntAngelMed已在OpenAI发起的HealthBench和国家人工智能应用中试基地（医疗）的MedAIBench等评测基准中表现出色，树立了开源AI医疗模型「高效、专业、安全」的新标杆。

在由OpenAI主导、全球262名医生参与构建的HealthBench评测中，AntAngelMed在HealthBench上的评分达到开源模型第一，超过DeepSeek-R1、Qwen3、OpenAI GPT-OSS等模型，并且在极具挑战性的HealthBench-Hard子集上展现出尤为显著的优势，充分证明了其在真实、复杂医疗环境中的可靠性与专业性。

在由国家人工智能应用中试基地（医疗）·浙江联合中国医学科学院北京协和医学院、中国信息通信研究院三方共建的权威测评体系MedAIBench中，AntAngelMed同样展现出强大的综合专业性与安全性，在医疗知识问答、医疗伦理安全等多个核心维度表现突出。

这种「通用智能+医疗专长」的全栈能力闭环，标志着开源AI医疗模型进入了「高效、专业、安全」三者兼顾的新阶段，为AI技术在医疗领域的应用树立了新的标杆。

对于面向中文医疗场景医疗大模型评测体系MedBench（36个自主评测集，覆盖约70万条样本），AntAngelMed位列评测榜单第一，在医学知识问答、医学语言理解、医学语言生成、复杂医学推理、医疗安全与伦理五大核心维度也都表现出领先水平，体现出AntAngelMed医疗大模型的专业性、安全性与临床适用性。

AntAngelMed在MedBench上排名评测榜单第一

技术解析：三阶段专业训练

AntAngelMed卓越的医疗能力源于其专业、精细的三阶段训练流程。

首先，通过持续预训练对通用基座模型Ling-flash-2.0-base注入大规模、高质量的医学语料，构建了深厚的医疗知识底蕴；

随后，在监督微调阶段，通过多源异构的高质量指令数据，一方面强化了模型的通用核心思维链，另一方面针对医患问答、诊断推理等真实医疗场景进行深度适配；

最后，AntAngelMed采用先进的GRPO强化学习算法，并通过双阶段强化学习路径对模型能力进一步优化提升：首先以「推理强化学习」锻造其逻辑推理的核心能力，再以「通用强化学习」打磨其同理心与安全边界意识，最终实现了医疗专业性与人文关怀的高度统一。

好文章，需要你的鼓励