## Google发布Gemma 4:Apache 2.0许可的最强开源模型家族
4月2日,Google DeepMind正式发布Gemma 4模型系列,包含2B、4B、26B(MoE)、31B四个版本,全部采用Apache 2.0开源许可证——Gemma家族有史以来最宽松的许可协议。
**核心亮点:**
- 31B版本在Arena AI全球开源模型排名中以1452 Elo得分位列第三,仅次于GPT-5和Claude
- 26B MoE版本采用混合专家架构,专为高效率场景优化
- 2B/4B端侧版本支持文本、图像、视频原生输入,部分型号支持原生音频
- 更大上下文窗口达256,000 tokens
- 31B在AIME 2026数学竞赛得分89.2%,LiveCodeBench v6得分80.0%
Gemma 4发布首日即登陆Hugging Face、Ollama、vLLM、llama.cpp、MLX、LM Studio、NVIDIA NIM及Android Studio等主流平台,真正实现"发布即可用"。
---
## 微软发布三款自研MAI模型:首次独立于OpenAI打造前沿模型
同在4月2日,微软通过Microsoft Foundry和全新MAI Playground发布了三款自研AI模型,这是微软自与OpenAI合作以来首次完全独立开发的前沿级别生产模型。
**三款模型亮点:**
- **MAI-Transcribe-1**:语音识别模型,在25种语言平均WER仅3.8%,全面超越OpenAI Whisper Large v3和Gemini 3.1 Flash
- **MAI-Voice-1**:语音生成模型,支持60倍实时生成速度,用户仅需几秒音频样本即可克隆自定义音色,定价$22/百万字符,直接挑战ElevenLabs
- **MAI-Image-2**:图像生成模型,Arena.ai排名前三,生成速度较前代提升2倍,定价$5/百万输入tokens、$33/百万输出tokens,WPP等企业已率先接入
---
## Cohere发布开源ASR模型Transcribe:全面超越Whisper
3月26日,Cohere发布其首款语音识别开源模型Transcribe,以2B参数在Hugging Face开源ASR榜单以5.42% WER登顶,全面超越OpenAI Whisper Large v3(7.44%)、ElevenLabs Scribe v2(5.83%)和Qwen3-ASR-1.7B(5.76%)。人类评估中,64%的英语场景用户更偏好Transcribe。支持英语、法语、中文、阿拉伯语、日语等14种语言,采用Apache 2.0许可,可免费商用。
---
## 参考来源
- Google DeepMind Gemma 4:https://deepmind.google/gemma/
- Microsoft MAI Blog:https://azure.microsoft.com/en-us/blog/
- Hugging Face开源ASR榜单:https://huggingface.co/spaces/open-ai-evaluations/open-asr-leaderboard
- The AI Track 月度总结:https://theaitrack.com/ai-news-april-2026-in-depth-and-concise/
- AI Tools Recap:https://aitoolsrecap.com/Blog/ai-tools-updates-april-2026