跳到主要内容

使用 Mistral Voxtral 进行语音转文本

本指南介绍如何在 Open WebUI 中使用 Mistral 的 Voxtral 模型进行语音转文本 (STT)。Voxtral 是 Mistral 的语音转文本模型,可提供高精度的音频转录服务。

正在寻找 TTS?

请参阅配套指南:使用 Mistral 进行文本转语音

要求

  • Mistral API Key
  • 已安装并运行的 Open WebUI

快速设置 (UI)

  1. 点击您的头像图标(左下角)
  2. 选择 管理员面板 (Admin Panel)
  3. 点击 设置 (Settings)音频 (Audio) 选项卡
  4. 配置以下内容:
设置
语音转文本引擎 (Speech-to-Text Engine)MistralAI
API Key您的 Mistral API Key
STT 模型 (STT Model)voxtral-mini-latest(或留空以使用默认模型)
  1. 点击保存

可用模型

模型描述
voxtral-mini-latest默认转录模型(推荐)

环境变量设置

如果您更倾向于通过环境变量进行配置:

services:
  open-webui:
    image: ghcr.io/open-webui/open-webui:main
    environment:
      - AUDIO_STT_ENGINE=mistral
      - AUDIO_STT_MISTRAL_API_KEY=your-mistral-api-key
      - AUDIO_STT_MODEL=voxtral-mini-latest
    # ... 其他配置

所有 Mistral STT 环境变量

变量描述默认值
AUDIO_STT_ENGINE设置为 mistral空(使用本地 Whisper)
AUDIO_STT_MISTRAL_API_KEY您的 Mistral API Key
AUDIO_STT_MISTRAL_API_BASE_URLMistral API Base URLhttps://api.mistral.ai/v1
AUDIO_STT_MISTRAL_USE_CHAT_COMPLETIONS使用 Chat Completions 端点false
AUDIO_STT_MODELSTT 模型voxtral-mini-latest

转录方法

Mistral 支持两种转录方法:

标准转录(默认)

使用专用的转录端点。这是推荐的方法。

Chat Completions 方法

设置 AUDIO_STT_MISTRAL_USE_CHAT_COMPLETIONS=true 可以使用 Mistral 的 Chat Completions API 进行转录。此方法:

  • 需要 mp3 或 wav 格式的音频(系统会尝试自动转换)
  • 可能提供与标准端点不同的转录结果

使用 STT

  1. 点击聊天输入框中的麦克风图标
  2. 说话输入您的消息
  3. 再次点击麦克风,或等待静音检测自动停止
  4. 您的语音将被转录并显示在输入框中

支持的音频格式

Voxtral 接受常见的音频格式。系统默认接受 audio/*video/webm

如果使用 Chat Completions 方法,音频会自动转换为 mp3。

故障排除

API Key 错误

如果您看到“需要 Mistral API Key”:

  1. 验证您的 API Key 是否输入正确
  2. 检查 API Key 是否已过期
  3. 确保您的 Mistral 账户拥有 API 访问权限

转录无法工作

  1. 检查容器日志:docker logs open-webui -f
  2. 验证 STT 引擎是否设置为 MistralAI
  3. 尝试使用标准转录方法(禁用 Chat Completions)

音频格式问题

如果使用 Chat Completions 方法且音频转换失败:

  • 确保容器中已安装 FFmpeg
  • 尝试以不同格式(wav 或 mp3)进行录音
  • 切换回标准转录方法

有关更多故障排除信息,请参阅 音频故障排除指南

与其他 STT 选项的对比

特性Mistral VoxtralOpenAI Whisper本地 Whisper
成本按分钟计费按分钟计费免费
隐私音频发送到 Mistral音频发送到 OpenAI音频保留在本地
模型选项voxtral-mini-latestwhisper-1tiny → large
需要 GPU不需要不需要推荐

成本考量

Mistral 收取每分钟音频的 STT 费用。请查看 Mistral 定价页面 了解当前价格。

提示

如需免费 STT,请使用 本地 Whisper(默认)或浏览器的 Web API 进行基础转录。

This content is for informational purposes only and does not constitute a warranty, guarantee, or contractual commitment. Open WebUI is provided "as is." See your license for applicable terms.