时间:2026年6月2日
地点:中国杭州
人物:阿里云通义千问团队
事件详情:阿里云通义千问团队正式发布Qwen3.7-Plus多模态Agent模型,这是一款具备颠覆性能力的AI模型。该模型的核心理念是一个模型能看、能想、能写代码、能行动,不仅能够识别屏幕内容,还能根据视觉信息生成相应代码并自主执行任务。
背景:Qwen3.7-Plus发布时间恰逢MiniMax M3模型面世,标志着国内大模型开源竞赛的白热化。该模型在多模态基准测试中表现优异,屏幕理解得分达到79,超越了GPT-5.4和Gemini-3.1 Pro,展示了其在技术上的领先地位。
影响:
- Hybrid-Agent系统连续稳定运行超过11小时,成功研发英语学习App
- 复刻macOS原生Stocks股市应用,展示复杂应用理解能力
- 生成超过1万行代码,完成从需求文档到产品说明的完整闭环
- 降低开发门槛,简化复杂开发流程
总结:Qwen3.7-Plus将视觉理解与任务执行相结合,使模型不仅限于看懂图片,更能理解手机或电脑屏幕上的具体操作。它能识别设计图并生成SVG格式网页原型,或在命令行中执行代码并修复错误。这种能力在实际应用中极具潜力,尤其在复杂的开发流程中能够显著提高效率,为开发者和企业提供了强大的新工具。
参考来源:
https://www.sohu.com/a/1031007978_122004016









