Voxtral怎么用？教程来了

Voxtral 到底是什么？一句话讲清它的定位

你可以把 Voxtral 理解为 “超级 AI 同声传译 + 语音转写机”，但它比传统工具强在三点：

声音还原度极高：它用的是 ElevenLabs 最擅长的神经网络语音合成技术，转写和翻译后的朗读声音几乎听不出是 AI，能保留原说话人的语气、停顿甚至情绪。
处理速度快：支持实时流式处理，你这边音频还没播完，文字和翻译结果就已经出来了。
多语言无缝切换：支持输入 29 种语言，输出翻译成 30+ 种语言，并且翻译质量在专业领域（如法律、医疗）表现不错。

它背后的公司 ElevenLabs 是一家专注于 AI 语音的独角兽公司，以“让声音听起来像真人”闻名。Voxtral 功能目前包含在 ElevenLabs Reader App 的付费订阅中，但也有一定的免费试用额度。

下面我会按 “准备工作 → 导入音频 → 设置语言 → 获取转写/翻译 → 导出结果” 的逻辑，手把手教你操作。

Voxtral 不是网页版工具，它目前只集成在 ElevenLabs Reader 移动端 App 里（iOS 和 Android 都有）。

官网入口：ElevenLabs 官网，在首页点击“Reader App”即可跳转应用商店下载。
注意：需要注册 ElevenLabs 账号。注册后，免费用户每月有 30 分钟 的 Voxtral 使用额度（包括转写和翻译的总时长），超出后需要订阅付费计划（起价 $5/月，具体价格见官网）。

打开 App 后，你会看到底部菜单栏。关键入口在：

小提示：如果你只是想快速测试，可以直接在 App 内录制一段语音，或者从手机本地选择一段音频文件（支持 mp3、m4a、wav 等常见格式）。

进入 Voxtral 界面后，你会看到一个简洁的设置面板：

注意：如果你要处理的是外语播客或会议录音，建议开启 “说话人分离” 功能（Speaker Diarization），这样转写结果会自动标出不同说话人（比如“说话人A：… 说话人B：…”）。

设置完成后，点击 “开始” 按钮。App 会开始播放音频（或你录制的语音），同时屏幕会实时滚动显示：

实战场景举例：你正在听一个英文的科技播客（比如 Lex Fridman 的访谈），打开 Voxtral 后，它一边显示英文原文，一边显示中文翻译，你还可以选择只听中文翻译版本，感觉就像在听一个中文主播在讲同样的内容，声音非常自然。

处理完成后，你会看到一个 “完成” 界面。这里可以做三件事：

小技巧：如果你需要给视频加外语字幕，导出 SRT 文件后，导入剪辑软件（如 Pr、剪映）即可自动匹配时间轴。

市面上类似的产品不多，但最常被拿来比较的是 OpenAI Whisper（官网）和 Google Recorder。我列个表方便你对比：

功能点	Voxtral (ElevenLabs)	OpenAI Whisper	Google Recorder
实时翻译	支持（且可朗读翻译结果）	仅转写，翻译需二次开发	仅转写，无翻译
声音质量	极好（AI 声音像真人）	无朗读功能	一般（Google TTS）
说话人分离	支持（较精准）	不支持原生	支持（但准确度一般）
处理速度	实时流式	需上传后等待	实时
费用	免费 30 分钟/月，之后 $5/月起	免费（自部署）	免费（Pixel 手机限定）
平台	iOS + Android App	API / 本地	仅 Pixel 手机

一句话总结：如果你需要“听完外语内容后直接看中文翻译，并且想用自然的声音听翻译版”，Voxtral 是目前体验最好的选择。如果你只是需要免费转写文字（不要求翻译和朗读），Whisper 是更好的选择。

用 Voxtral 学外语：把外语新闻或播客丢进去，开启“双语对照”模式（App 内可设置），一边听原声，一边看中英对照文字，比传统字幕学习效果好很多。
生成会议纪要：录制会议音频后，用 Voxtral 转写并翻译，然后导出 TXT 文件，再配合 ChatGPT 总结要点，几分钟搞定一份双语会议纪要。
给视频加双语字幕：用 Voxtral 导出 SRT 文件后，用剪映或 Subtitle Edit 调整时间轴，就能做出带双语字幕的视频。
配合其他 AI 工具使用：比如先用 Voxtral 转写一段英文播客，然后把转写文本粘贴到 Claude（官网）或 ChatGPT（官网）里，让它帮你提炼金句、写摘要。

Q：为什么我的 Voxtral 不显示中文翻译？
A：检查输出语言是否选择了中文（简体）。如果选了，但翻译结果还是英文，可能是网络问题，建议切换网络或重启 App。
Q：处理长音频（超过1小时）会崩溃吗？
A：实测 2 小时以内的音频比较稳定，但建议分段处理（每段 30 分钟左右），以免 App 内存溢出。
Q：免费额度用完了怎么办？
A：可以订阅最低 $5/月的计划（包含 3 小时 Voxtral 时长），或者等次月额度重置。不建议用多个账号刷额度，可能被封。
Q：Voxtral 支持中文输入吗？
A：支持中文输入（即你可以把中文音频转写成中文文字），但翻译成其他语言时质量不错，中文转英文的准确度在 85% 以上。