时间:2026年6月18日
地点:中国杭州
人物:阿里巴巴ATH-Token Foundry、中国人民大学高瓴人工智能学院
事件详情:
2026年6月18日,阿里巴巴ATH-Token Foundry联合中国人民大学高瓴人工智能学院,正式开源首个基于统一"科学语法"的多领域科学生成基础模型LOGOS(Language Of Generative Objects in Science)。模型权重、推理代码与技术报告同步在HuggingFace和GitHub开放下载。在六大代表性科学任务上,LOGOS以纯序列建模范式一致匹配或超越领域专用方法。LOGOS-1B仅以1B参数就在多项任务上击败了参数量高达8×7B的微软NatureLM,参数效率提升56倍。
背景:
传统科研AI需依赖显式3D坐标和复杂的几何神经网络才能理解蛋白质与小分子的空间互作,且不同环节(结构预测、分子生成、反应预测)必须切换不同模型。LOGOS首创"科学语法":把蛋白质、抗体、小分子、MOF材料等异构对象统一编码为离散Token序列,发明"文字描述法"将3D空间接触模式语法化为离散Token,无需3D坐标即可在序列预测中构建空间互作规律。预训练语料涵盖7类模态共44.87B tokens,包括蛋白质28.9B、抗体3.0B、小分子2.1B、化学反应与MOF材料0.47B、蛋白质口袋5.8B、蛋白口袋-配体复合物4.6B。
影响:
- 打破"换任务换模型"范式,模型预训练与下游任务形式目标完全对齐,无需复杂微调即可激活生成能力
- 中国AI首次在科学基础模型细分赛道以极致参数效率实现对国际大厂的反超
- 推动AI for Science走向"统一语法"新范式,为生命科学、材料、化学研发提供低成本工具
总结:
阿里ATH-Token Foundry与人大联合开源的LOGOS用1B参数撬动56倍效率优势,不仅让"科学语法"成为AI for Science的新共识,也再次印证中国AI在基础研究和开源生态上正在换道超车。该模型的开源有望重塑多模态科学大模型的技术路径,让更多科研团队以低成本获得前沿能力。
参考来源:
- https://baijiahao.baidu.com/s?id=1868307851998235697
- http://news.10jqka.com.cn/20260618/c677562035.shtml
- https://baijiahao.baidu.com/s?id=1868315051541206677
- https://huggingface.co/LOGOS-Hub
- https://github.com/LOGOS-Hub/LOGOS
- https://arxiv.org/abs/2606.16905









