时间:2026年4月21日
地点:中国
人物:阿里巴巴、Fun-ASR1.5
事件详情:阿里巴巴推出Fun-ASR1.5端到端语音识别大模型,无需预设语种标签,可精准识别30种语言。该模型完整覆盖中文七大方言与二十余种地方口音,还专项优化古诗词诵读识别精度。目前该模型已落地跨国办公、国际会议、多语直播、县域政务、国学教育等场景。
背景:语音识别技术是AI应用的重要领域,随着大模型技术的发展,语音识别能力不断提升。Fun-ASR1.5的推出标志着阿里在语音AI领域的技术突破,从通用工具向垂直领域深度渗透。
影响:
- 多语言支持:精准识别30种语言,无需预设语种标签
- 方言覆盖:完整覆盖中文七大方言与二十余种地方口音
- 特色优化:专项优化古诗词诵读识别精度
- 应用场景:跨国办公、国际会议、多语直播、县域政务、国学教育
总结:阿里发布Fun-ASR1.5语音大模型是语音AI领域的重要进展。无需预设语种标签的设计,使模型能够自动识别30种语言,大幅提升了用户体验。中文方言和古诗词专项优化,体现了阿里对中国本土需求的深入理解。多场景落地应用,推动语音AI从通用工具向垂直领域深度渗透。这一技术将在国际交流、教育培训、政务服务等场景发挥重要作用。
参考来源:
- https://so.html5.qq.com/page/real/search_news?docid=70000021_86969e75d8826552