跳到主要内容

环境变量

环境变量列表

信息

有关所有 Open WebUI 环境变量的完整列表,请参阅 环境变量配置 页面。

以下是语音转文本 (STT) 和文本转语音 (TTS) 环境变量的汇总。

UI 配置

这些设置中的大多数也可以在 管理员面板 → 设置 → 音频 选项卡中进行配置。环境变量在启动时具有最高优先级,但可以在 UI 中进行覆盖。

语音转文本 (STT) 环境变量

预处理

变量描述默认值
BYPASS_PYDUB_PREPROCESSING绕过基于 pydub 的预处理(MP3 转换、压缩、分片切割),然后再将音频发送到 STT 引擎。适用于所有引擎。当上游提供商已处理这些步骤,或者主机上无法使用 ffmpeg 时非常有用。false

本地 Whisper

变量描述默认值
WHISPER_MODELWhisper 模型大小base
WHISPER_MODEL_DIR存储 Whisper 模型文件的目录{CACHE_DIR}/whisper/models
WHISPER_COMPUTE_TYPE推理的计算类型(参见下方说明)int8
WHISPER_LANGUAGEISO 639-1 语言代码(为空 = 自动检测)
WHISPER_MULTILINGUAL使用多语言 Whisper 模型false
WHISPER_MODEL_AUTO_UPDATE自动下载模型更新false
WHISPER_VAD_FILTER启用语音活动检测 (VAD) 过滤器false
WHISPER_COMPUTE_TYPE 选项
  • int8 — CPU 默认,最快,但可能无法在较旧的 GPU 上运行
  • float16CUDA/GPU 推荐
  • int8_float16 — 混合模式(int8 权重,float16 计算)
  • float32 — 最大兼容性,最慢

如果使用带有较旧 GPU 的 :cuda Docker 镜像,请设置 WHISPER_COMPUTE_TYPE=float16 以避免报错。

兼容 OpenAI 的 STT

变量描述默认值
AUDIO_STT_ENGINESTT 引擎:为空(本地 Whisper)、openaiazuredeepgrammistral
AUDIO_STT_MODEL外部提供商的 STT 模型
AUDIO_STT_OPENAI_API_BASE_URL兼容 OpenAI 的 API Base URLhttps://api.openai.com/v1
AUDIO_STT_OPENAI_API_KEYOpenAI API Key
AUDIO_STT_SUPPORTED_CONTENT_TYPES以逗号分隔的支持的音频 MIME 类型列表

Azure STT

变量描述默认值
AUDIO_STT_AZURE_API_KEYAzure Cognitive Services API Key
AUDIO_STT_AZURE_REGIONAzure 区域eastus
AUDIO_STT_AZURE_LOCALES逗号分隔的区域设置(例如:en-US,de-DEauto
AUDIO_STT_AZURE_BASE_URL自定义 Azure Base URL(可选)
AUDIO_STT_AZURE_MAX_SPEAKERS说话人日志(Diarization)的最大说话人数量3

Deepgram STT

变量描述默认值
DEEPGRAM_API_KEYDeepgram API Key

Mistral STT

变量描述默认值
AUDIO_STT_MISTRAL_API_KEYMistral API Key
AUDIO_STT_MISTRAL_API_BASE_URLMistral API Base URLhttps://api.mistral.ai/v1
AUDIO_STT_MISTRAL_USE_CHAT_COMPLETIONS使用 Chat Completions 端点false

文本转语音 (TTS) 环境变量

通用 TTS

变量描述默认值
AUDIO_TTS_ENGINETTS 引擎:为空(禁用)、openaimistralelevenlabsazuretransformers
AUDIO_TTS_MODELTTS 模型tts-1
AUDIO_TTS_VOICE默认音色alloy
AUDIO_TTS_SPLIT_ON文本切分依据:punctuation(标点)、paragraphs(段落)或 none(无)punctuation
AUDIO_TTS_API_KEYElevenLabs 或 Azure TTS 的 API Key

兼容 OpenAI 的 TTS

变量描述默认值
AUDIO_TTS_OPENAI_API_BASE_URL兼容 OpenAI 的 TTS API Base URLhttps://api.openai.com/v1
AUDIO_TTS_OPENAI_API_KEYOpenAI TTS API Key
AUDIO_TTS_OPENAI_PARAMSOpenAI TTS 的其他 JSON 参数

Mistral TTS

变量描述默认值
AUDIO_TTS_MISTRAL_API_KEYMistral TTS API Key
AUDIO_TTS_MISTRAL_API_BASE_URLMistral API Base URLhttps://api.mistral.ai/v1
信息

AUDIO_TTS_ENGINE=mistralAUDIO_TTS_MODEL 为空时,Open WebUI 将使用 mistral-tts-latest

Azure TTS

变量描述默认值
AUDIO_TTS_AZURE_SPEECH_REGIONAzure Speech 区域eastus
AUDIO_TTS_AZURE_SPEECH_BASE_URL自定义 Azure Speech Base URL(可选)
AUDIO_TTS_AZURE_SPEECH_OUTPUT_FORMAT音频输出格式audio-24khz-160kbitrate-mono-mp3

音频配置技巧

使用本地 Whisper STT

针对 GPU 加加速问题或较旧的 GPU,尝试设置:

environment:
  - WHISPER_COMPUTE_TYPE=float16

使用外部 TTS 服务

在 Docker 中运行 Open WebUI 并使用外部 TTS 服务时:

environment:
  - AUDIO_TTS_ENGINE=openai
  - AUDIO_TTS_OPENAI_API_BASE_URL=http://host.docker.internal:5050/v1
  - AUDIO_TTS_OPENAI_API_KEY=your-api-key
提示

在 Docker Desktop (Windows/Mac) 上使用 host.docker.internal 可以访问主机上的服务。在 Linux 上,请使用主机 IP 或容器网络。

要排查音频问题,请参阅 音频故障排除指南

This content is for informational purposes only and does not constitute a warranty, guarantee, or contractual commitment. Open WebUI is provided "as is." See your license for applicable terms.