Meta发布Muse Spark:华人科学家天团重构AI栈,算力效率提升超10倍

2026年4月8日,美国加州门洛帕克,Meta公司

Meta正式发布了MSL(Meta Superintelligence Labs)成立以来的第一个模型Muse Spark,这是由Alexandr Wang带领的华人科学家团队在九个月内从零搭建的新AI技术栈的首个成果,标志着Meta在Llama 4失败后的全面重启。

事件详情:

Muse Spark是一个原生多模态推理模型,与之前的Llama系列完全不同。它的核心特点包括:原生多模态架构(从预训练阶段起文本、图像、语音就在同一特征空间训练)、Visual Chain of Thought视觉思维链(能在图像中思考,自主构建视觉元素之间的逻辑关系)、Contemplating Mode沉思模式(对标Gemini Deep Think和GPT Pro),以及原生工具调用和多agent编排能力。

最引人注目的是效率突破:新栈达到同等能力水平所需的算力比Llama 4 Maverick减少了超过一个数量级(10倍以上),并且比其他领先的基础模型都更高效。首席科学家赵晟佳强调预训练、强化学习、测试时推理三条线都看到了可预测的scaling曲线,这意味着这套栈是一个可预测、可扩展的系统。

背景:

九个月前,Llama 4因benchmark造假风波陷入巨大争议,扎克伯格决定彻底推翻过去的技术路线。他从OpenAI挖来了余家辉(前感知团队负责人、GPT-4o核心开发者)、赵晟佳(前合成数据研发领头人、ChatGPT联合创作者)、任泓宇(前o1/o3推理核心贡献者)、毕树超(前多模态后训练负责人)、林纪(前核心优化专家)等华人科学家,用上亿美元的签字费组建了这支天团,从基础设施、架构、数据管道全部从零开始。

影响:

1. 医疗多模态领域领先 - HealthBench Hard得分42.8,接近GPT-5.4的2倍、Claude Opus 4.6的3倍
2. 科研图表理解突破 - CharXiv Reasoning得分86.4,全行业最高
3. 软件工程能力进入第一梯队 - SWE-bench Pro达到55.0%,超过Claude Opus 4.6
4. 算力效率革命 - 同等性能下算力消耗降低10倍以上,为更大模型铺平道路

总结:

Meta Muse Spark的发布不仅是技术突破,更是战略转型的标志。扎克伯格亲手拆除了整个Llama团队和架构,选择了一条与开源Llama完全相反的闭源路线,显示出他对过去路线的彻底否定。华人科学家团队在九个月内交出的答卷证明了这个决定的正确性:新栈不仅在特定领域实现了绝对领先,更重要的是展示了可预测的scaling能力,为未来更大规模的模型奠定了基础。余家辉团队在重构过程中攻克了大规模RL的不稳定性、奖励机制作弊等核心难题,最终实现了训练过程的平滑可预测。虽然综合能力仍落后GPT-5.4和Gemini 3.1 Pro约5分,但在医疗和科研图表这两个需要真正理解视觉信息的领域,Muse Spark已经展现出原生多模态架构的独特优势。更大的模型已经在路上,Meta正在用这套新栈重新定义AI竞争格局。

参考来源:
https://www.pingwest.com/a/312773
https://meta.ai/
https://www.theverge.com/ai-artificial-intelligence
https://techcrunch.com/category/artificial-intelligence/
https://www.wired.com/tag/artificial-intelligence/
https://www.anthropic.com/research
https://openai.com/blog/