阿里发布Qwen3.6-Max-Preview:编程能力显著提升,登顶最佳国产模型

时间:2026年4月20日

地点:中国杭州

人物:阿里巴巴

事件详情:阿里巴巴正式发布Qwen3.6-Max-Preview模型,这是Qwen系列新一代旗舰模型的早期预览版本。该模型已在Qwen Studio平台开放交互式对话体验,即将通过阿里云百炼平台提供API调用服务,调用名称为qwen3.6-max-preview。根据权威第三方评测榜单Artificial Analysis显示,该模型性能表现超过GLM5.1、MiniMax-M2.7等模型,登顶最佳国产模型宝座。

背景:Qwen3.6-Max-Preview定位为面向高阶任务场景的前沿技术验证形态,相比前代Qwen3.6-Plus版本,在智能体编程能力、世界知识和指令遵循能力方面均实现显著提升。该预览版还在多个真实场景测试中展现出更好的智能体能力和知识可靠性,能够解决更复杂、更长程的任务。

影响:
- 智能体编程能力大幅提升:SkillsBench评测得分提升9.9分,SciCode提升10.8分,NL2Repo提升5.0分,Terminal-Bench 2.0提升3.8分
- 六项主流基准测试进入前列:在SWE-bench Pro、Terminal-Bench 2.0、SkillsBench等编程领域核心评测中均表现出色
- 世界知识和指令遵循能力增强:SuperGPQA提升2.3分,QwenChineseBench提升5.3分,ToolcallFormatIFBench提升2.8分
- 登顶最佳国产模型:性能表现超过GLM5.1、MiniMax-M2.7等知名模型,展现国产大模型技术实力
- 新增preserve_thinking功能:可保留所有前序轮次的思维内容,适用于智能体任务

总结:Qwen3.6-Max-Preview的发布标志着阿里在人工智能大模型领域的持续创新与技术突破。该模型在智能体编程、知识处理和指令遵循等多方面展现出强劲实力,为开发者和企业用户提供了更强大的AI工具。作为预览版,模型仍在积极迭代中,后续版本将持续优化以满足更高阶的应用需求。阿里云百炼API兼容OpenAI规范和Anthropic规范,方便开发者快速接入使用。

参考来源:
- https://tech.ifeng.com/c/8sTmwUdJHAv
- https://m.zol.com.cn/article/11690796.html
- https://www.sohu.com/a/1012033301_121885030
- https://www.toutiao.com/article/7631103066133070362/
- https://so.html5.qq.com/page/real/search_news?docid=70000021_20669e7115555065
- http://field.10jqka.com.cn/20260420/c676116073.shtml
- https://new.qq.com/rain/a/20260420A061FC00
- https://www.ebrun.com/ebrungo/zb/656700.shtml

热门AI工具推荐

AI编程订阅服务,支持多款国产主流编程模型自由切换。
Seedance 2.0AI视频生成
具备卓越的物理真实性和角色一致性,可生成电影级视频内容。
SpeedAIAI内容检测降重
AI内容检测与降重工具,能有效帮助用户通过论文AI率检测
MonkeyCodeAI编程平台
企业级AI编程平台,支持私有化部署和自然语言编程以及MiniMax-M2.7免费无限量使用
秒哒AI工具
不懂代码也能开发应用?百度秒哒:无需编程,快速搭建小程序与网站
有戏AIAI漫剧生成工具
全流程AI短剧创作工具,实现从剧本到成片的自动化生产,让“一人即剧组”成为现实。
沁言学术智能科研平台
一站式文献管理与科研写作工具,支持边写作边搜索文献,高效阅读,文献管理,