环境变量

环境变量列表

信息

有关所有 Open WebUI 环境变量的完整列表，请参阅环境变量配置页面。

以下是语音转文本 (STT) 和文本转语音 (TTS) 环境变量的汇总。

UI 配置

这些设置中的大多数也可以在 管理员面板 → 设置 → 音频 选项卡中进行配置。环境变量在启动时具有最高优先级，但可以在 UI 中进行覆盖。

语音转文本 (STT) 环境变量

预处理

变量	描述	默认值
`BYPASS_PYDUB_PREPROCESSING`	绕过基于 pydub 的预处理（MP3 转换、压缩、分片切割），然后再将音频发送到 STT 引擎。适用于所有引擎。当上游提供商已处理这些步骤，或者主机上无法使用 ffmpeg 时非常有用。	`false`

本地 Whisper

变量	描述	默认值
`WHISPER_MODEL`	Whisper 模型大小	`base`
`WHISPER_MODEL_DIR`	存储 Whisper 模型文件的目录	`{CACHE_DIR}/whisper/models`
`WHISPER_COMPUTE_TYPE`	推理的计算类型（参见下方说明）	`int8`
`WHISPER_LANGUAGE`	ISO 639-1 语言代码（为空 = 自动检测）	空
`WHISPER_MULTILINGUAL`	使用多语言 Whisper 模型	`false`
`WHISPER_MODEL_AUTO_UPDATE`	自动下载模型更新	`false`
`WHISPER_VAD_FILTER`	启用语音活动检测 (VAD) 过滤器	`false`

WHISPER_COMPUTE_TYPE 选项

int8 — CPU 默认，最快，但可能无法在较旧的 GPU 上运行
float16 — CUDA/GPU 推荐
int8_float16 — 混合模式（int8 权重，float16 计算）
float32 — 最大兼容性，最慢

如果使用带有较旧 GPU 的 :cuda Docker 镜像，请设置 WHISPER_COMPUTE_TYPE=float16 以避免报错。

兼容 OpenAI 的 STT

变量	描述	默认值
`AUDIO_STT_ENGINE`	STT 引擎：为空（本地 Whisper）、`openai`、`azure`、`deepgram`、`mistral`	空
`AUDIO_STT_MODEL`	外部提供商的 STT 模型	空
`AUDIO_STT_OPENAI_API_BASE_URL`	兼容 OpenAI 的 API Base URL	`https://api.openai.com/v1`
`AUDIO_STT_OPENAI_API_KEY`	OpenAI API Key	空
`AUDIO_STT_SUPPORTED_CONTENT_TYPES`	以逗号分隔的支持的音频 MIME 类型列表	空

Azure STT

变量	描述	默认值
`AUDIO_STT_AZURE_API_KEY`	Azure Cognitive Services API Key	空
`AUDIO_STT_AZURE_REGION`	Azure 区域	`eastus`
`AUDIO_STT_AZURE_LOCALES`	逗号分隔的区域设置（例如：`en-US,de-DE`）	auto
`AUDIO_STT_AZURE_BASE_URL`	自定义 Azure Base URL（可选）	空
`AUDIO_STT_AZURE_MAX_SPEAKERS`	说话人日志（Diarization）的最大说话人数量	`3`

Deepgram STT

变量	描述	默认值
`DEEPGRAM_API_KEY`	Deepgram API Key	空

Mistral STT

变量	描述	默认值
`AUDIO_STT_MISTRAL_API_KEY`	Mistral API Key	空
`AUDIO_STT_MISTRAL_API_BASE_URL`	Mistral API Base URL	`https://api.mistral.ai/v1`
`AUDIO_STT_MISTRAL_USE_CHAT_COMPLETIONS`	使用 Chat Completions 端点	`false`

文本转语音 (TTS) 环境变量

通用 TTS

变量	描述	默认值
`AUDIO_TTS_ENGINE`	TTS 引擎：为空（禁用）、`openai`、`mistral`、`elevenlabs`、`azure`、`transformers`	空
`AUDIO_TTS_MODEL`	TTS 模型	`tts-1`
`AUDIO_TTS_VOICE`	默认音色	`alloy`
`AUDIO_TTS_SPLIT_ON`	文本切分依据：`punctuation`（标点）、`paragraphs`（段落）或 `none`（无）	`punctuation`
`AUDIO_TTS_API_KEY`	ElevenLabs 或 Azure TTS 的 API Key	空

兼容 OpenAI 的 TTS

变量	描述	默认值
`AUDIO_TTS_OPENAI_API_BASE_URL`	兼容 OpenAI 的 TTS API Base URL	`https://api.openai.com/v1`
`AUDIO_TTS_OPENAI_API_KEY`	OpenAI TTS API Key	空
`AUDIO_TTS_OPENAI_PARAMS`	OpenAI TTS 的其他 JSON 参数	空

Mistral TTS

变量	描述	默认值
`AUDIO_TTS_MISTRAL_API_KEY`	Mistral TTS API Key	空
`AUDIO_TTS_MISTRAL_API_BASE_URL`	Mistral API Base URL	`https://api.mistral.ai/v1`

信息

当 AUDIO_TTS_ENGINE=mistral 且 AUDIO_TTS_MODEL 为空时，Open WebUI 将使用 mistral-tts-latest。

Azure TTS

变量	描述	默认值
`AUDIO_TTS_AZURE_SPEECH_REGION`	Azure Speech 区域	`eastus`
`AUDIO_TTS_AZURE_SPEECH_BASE_URL`	自定义 Azure Speech Base URL（可选）	空
`AUDIO_TTS_AZURE_SPEECH_OUTPUT_FORMAT`	音频输出格式	`audio-24khz-160kbitrate-mono-mp3`

音频配置技巧

使用本地 Whisper STT

针对 GPU 加加速问题或较旧的 GPU，尝试设置：

environment:
  - WHISPER_COMPUTE_TYPE=float16

使用外部 TTS 服务

在 Docker 中运行 Open WebUI 并使用外部 TTS 服务时：

environment:
  - AUDIO_TTS_ENGINE=openai
  - AUDIO_TTS_OPENAI_API_BASE_URL=http://host.docker.internal:5050/v1
  - AUDIO_TTS_OPENAI_API_KEY=your-api-key

提示

在 Docker Desktop (Windows/Mac) 上使用 host.docker.internal 可以访问主机上的服务。在 Linux 上，请使用主机 IP 或容器网络。

要排查音频问题，请参阅音频故障排除指南。

This content is for informational purposes only and does not constitute a warranty, guarantee, or contractual commitment. Open WebUI is provided "as is." See your license for applicable terms.

环境变量列表​

语音转文本 (STT) 环境变量​

预处理​

本地 Whisper​

兼容 OpenAI 的 STT​

Azure STT​

Deepgram STT​

Mistral STT​

文本转语音 (TTS) 环境变量​

通用 TTS​

兼容 OpenAI 的 TTS​

Mistral TTS​

Azure TTS​

音频配置技巧​

使用本地 Whisper STT​

使用外部 TTS 服务​