时间:2026年6月23日
地点:中国北京
人物:百川智能创始人兼CEO王小川,清华大学人工智能研究院团队
事件详情:2026年6月23日,百川智能与清华大学联合推出医疗增强大模型Baichuan-M4。该模型在国际权威医学评测集HealthBench上斩获三项世界第一:综合评分达68.6分,领先OpenAI GPT-5.5超过10分,展现出对医学知识的深度理解能力。更值得关注的是,Baichuan-M4的事实性幻觉率低至3.3%,远低于行业平均水平。在SCAN-bench动态评测中,该模型的初诊得分接近80%,展现出主动问诊的临床思维能力——这意味着模型不仅能回答问题,还能像医生一样主动询问患者症状、追溯病史、给出诊疗建议,实现了从"被动问答"到"主动诊疗"的能力跃升。
背景:百川智能由前搜狗CEO王小川于2023年创立,核心团队拥有丰富的搜索与AI技术积累。医疗AI一直是AI应用最具挑战性的赛道之一,领域知识门槛高、对准确率和可靠性要求极为严苛。此前,全球医疗AI评测主要由OpenAI的GPT系列和Anthropic的Claude系列占据榜首,国内大模型在专业医学领域的表现与国际顶尖水平存在差距。Baichuan-M4融合了百川智能在大语言模型领域的技术积淀和清华大学在医学AI领域的深厚研究积累,通过大量高质量医疗数据微调和强化学习,大幅提升了模型在医疗场景下的综合能力。
影响:
- Baichuan-M4在HealthBench上领先GPT-5.5超过10分,标志着国产AI大模型在专业医疗领域首次实现对国际顶级模型的全面超越,证明中国AI可以在高壁垒垂直行业实现"弯道超车"。
- 仅3.3%的幻觉率加上接近80%的初诊准确率,使该模型具备了辅助临床诊断的潜力——如果大规模部署到基层医疗场景,有望极大缓解医疗资源不均衡的问题,让偏远地区患者获得高质量的AI辅助诊疗服务。
- 清华大学与百川智能的"产研结合"模式,为医疗AI赛道树立了标杆——头部AI企业与顶尖科研院所的深度合作,能有效打通从技术研究到产品落地的最后一公里,加速AI在医疗领域的商业化进程。
总结:百川智能与清华大学联合推出的Baichuan-M4医疗大模型,在HealthBench上以大幅优势超越GPT-5.5,不仅实现了国产医疗大模型从追赶到领跑的历史性突破,也验证了中国在垂直行业AI应用方向上的创新实力。仅3.3%的极低幻觉率和主动问诊式临床思维,让"AI医生"从概念走向实用成为可能。随着医疗AI监管框架的逐步完善和临床验证的推进,Baichuan-M4有望成为推动中国智慧医疗发展的关键基础设施,在辅助诊断、健康管理、药物研发等场景中创造巨大价值。
参考来源:
- https://baijiahao.baidu.com/s?id=1868791202103984536
- http://www.cena.com.cn/intelligence/index.html
- https://baijiahao.baidu.com/s?id=1869056259762461110









