2026-04-21 19:57

阿里发布Fun-ASR1.5语音大模型，精准识别30种语言

时间：2026年4月21日

地点：中国

人物：阿里巴巴、Fun-ASR1.5

事件详情：阿里巴巴推出Fun-ASR1.5端到端语音识别大模型，无需预设语种标签，可精准识别30种语言。该模型完整覆盖中文七大方言与二十余种地方口音，还专项优化古诗词诵读识别精度。目前该模型已落地跨国办公、国际会议、多语直播、县域政务、国学教育等场景。

背景：语音识别技术是AI应用的重要领域，随着大模型技术的发展，语音识别能力不断提升。Fun-ASR1.5的推出标志着阿里在语音AI领域的技术突破，从通用工具向垂直领域深度渗透。

影响：
- 多语言支持：精准识别30种语言，无需预设语种标签
- 方言覆盖：完整覆盖中文七大方言与二十余种地方口音
- 特色优化：专项优化古诗词诵读识别精度
- 应用场景：跨国办公、国际会议、多语直播、县域政务、国学教育

总结：阿里发布Fun-ASR1.5语音大模型是语音AI领域的重要进展。无需预设语种标签的设计，使模型能够自动识别30种语言，大幅提升了用户体验。中文方言和古诗词专项优化，体现了阿里对中国本土需求的深入理解。多场景落地应用，推动语音AI从通用工具向垂直领域深度渗透。这一技术将在国际交流、教育培训、政务服务等场景发挥重要作用。

参考来源：
- https://so.html5.qq.com/page/real/search_news?docid=70000021_86969e75d8826552

热门AI工具推荐