2026-06-03 09:37 大模型

阿里云发布Qwen3.7-Plus多模态Agent模型

时间：2026年6月2日

地点：中国杭州

人物：阿里云通义千问团队

事件详情：阿里云通义千问团队正式发布Qwen3.7-Plus多模态Agent模型，这是一款具备颠覆性能力的AI模型。该模型的核心理念是一个模型能看、能想、能写代码、能行动，不仅能够识别屏幕内容，还能根据视觉信息生成相应代码并自主执行任务。

背景：Qwen3.7-Plus发布时间恰逢MiniMax M3模型面世，标志着国内大模型开源竞赛的白热化。该模型在多模态基准测试中表现优异，屏幕理解得分达到79，超越了GPT-5.4和Gemini-3.1 Pro，展示了其在技术上的领先地位。

影响：
- Hybrid-Agent系统连续稳定运行超过11小时，成功研发英语学习App
- 复刻macOS原生Stocks股市应用，展示复杂应用理解能力
- 生成超过1万行代码，完成从需求文档到产品说明的完整闭环
- 降低开发门槛，简化复杂开发流程

总结：Qwen3.7-Plus将视觉理解与任务执行相结合，使模型不仅限于看懂图片，更能理解手机或电脑屏幕上的具体操作。它能识别设计图并生成SVG格式网页原型，或在命令行中执行代码并修复错误。这种能力在实际应用中极具潜力，尤其在复杂的开发流程中能够显著提高效率，为开发者和企业提供了强大的新工具。

参考来源：
https://www.sohu.com/a/1031007978_122004016

热门AI工具推荐