时间:2026年6月10日
地点:中国
人物:小米MiMo技术团队
事件详情:小米MiMo技术团队上线XiaomiMiMo-V2.5-Pro-UltraSpeed模式,在通用GPU上推理速度突破1000tokens每秒,无需定制芯片。该模式基于SWA架构,通过全链路优化实现速度提升。即日起至6月23日,该模式将限时开放申请。小米AI在模型能力、推理成本和效率方面取得连续突破。
背景:随着AI大模型应用的普及,推理速度和成本成为关键瓶颈。小米MiMo技术团队通过架构创新和全链路优化,在通用GPU上实现了突破性的推理速度,降低了AI应用门槛,展现了小米在AI技术方面的创新能力。
影响:
- 显著降低AI推理成本和延迟
- 提升AI应用的用户体验
- 推动AI技术普及应用
总结:小米MiMo大模型推出UltraSpeed新模式,推理速度突破1000tokens每秒,通过全链路优化在通用GPU上实现突破性性能,降低了AI应用成本,为用户提供更快速的AI服务体验,展现了小米在AI技术方面的持续创新能力。
参考来源:
https://so.html5.qq.com/page/real/search_news?docid=70000021_2186a28e23034652









