跳到主要内容

Kokoro Web - 为 Open WebUI 提供的极简 TTS

注意

本教程为社区贡献,不属于 Open WebUI 官方支持内容。它仅作为如何针对特定用例定制 Open WebUI 的演示。想要参与贡献?请查看贡献教程。

什么是 Kokoro Web?

Kokoro Web 为强大的 Kokoro-82M 文本转语音 (TTS) 模型提供了一个轻量级的、兼容 OpenAI 的 API。它可以与 Open WebUI 无缝集成,使用自然流畅的声音来增强您的 AI 对话体验。

🚀 两步完成集成

1. 部署 Kokoro Web API(单条命令)

services:
  kokoro-web:
    image: ghcr.io/eduardolat/kokoro-web:latest
    ports:
      - "3000:3000"
    environment:
      # 更改为此处的任何密钥,以作为您兼容 OpenAI 的 API Key
      - KW_SECRET_API_KEY=your-api-key
    volumes:
      - ./kokoro-cache:/kokoro/cache
    restart: unless-stopped

使用以下命令运行:docker compose up -d

2. 连接 OpenWebUI(30 秒完成)

  1. 在 OpenWebUI 中,转到管理员面板 (Admin Panel) > 设置 (Settings) > 音频 (Audio)
  2. 配置以下内容:
    • 文本转语音引擎 (Text-to-Speech Engine): OpenAI
    • API Base URL: http://localhost:3000/api/v1 (如果是用 Docker 运行:http://host.docker.internal:3000/api/v1
    • API Key: your-api-key(步骤 1 中设置的值)
    • TTS 模型 (TTS Model): model_q8f16(尺寸与质量的最佳平衡点)
    • TTS 音色 (TTS Voice): af_heart(默认温暖、自然的英文女声)。您可以在 Kokoro Web 试用网页 中将其更改为任何其他音色或组合。

就这么简单!您的 OpenWebUI 现在已具备 AI 语音交互能力。

🌍 支持的语言

Kokoro Web 支持 8 种语言,并针对每种语言优化了特定的音色:

  • 英语 (美国) - en-us
  • 英语 (英国) - en-gb
  • 日语 - ja
  • 中文 - cmn
  • 西班牙语 - es-419
  • 印地语 - hi
  • 意大利语 - it
  • 葡萄牙语 (巴西) - pt-br

每种语言都有专用的音色以实现最佳发音和自然流动。您可以访问 GitHub 仓库 获取完整的各语言专属音色列表,或使用 Kokoro Web 试用网页 立即预览并自定义您自己的音色。

💾 适用于各种硬件的优化模型

您可以根据您的硬件条件选择匹配的模型:

模型 ID优化方式文件大小适用场景
model_q8f16混合精度86 MB推荐配置 - 最佳平衡点
model_quantized8 位量化92.4 MB优良的 CPU 性能
model_uint8f16混合精度114 MB在中端 CPU 上提供更好音质
model_q4f164 位量化与 fp16 权重154 MB音质更高,仍具效率
model_fp16fp16 半精度163 MB极佳音质
model_uint88 位与混合177 MB均衡选择
model_q44 位 matmul305 MB高质量选择
modelfp32 单精度326 MB极致音质(速度较慢)

✨ 安装前试用

访问 Kokoro Web 试用网页 即可立即预览所有音色。该 Demo 具备以下特点:

  • 100% 在您的浏览器中运行 - 无需后端服务器
  • 免费使用 - 无使用限制,无需注册
  • 零安装 - 访问网站即可开始创作
  • 包含完整特性 - 立即测试任何音色或语言

需要更多帮助?

如需其他配置选项、音色定制指南和高级设置,请访问 GitHub 仓库

故障排除

连接问题

如果 Open WebUI 无法连接到 Kokoro Web:

  • Docker Desktop (Windows/Mac):使用 http://host.docker.internal:3000/api/v1
  • Docker Compose (相同网络):使用 http://kokoro-web:3000/api/v1
  • Linux Docker:使用您主机的 IP 地址

语音无法工作

  1. 验证 Kokoro Web 配置与 Open WebUI 设置中的 Secret API Key 是否一致。
  2. 直接测试 API:
    curl -X POST http://localhost:3000/api/v1/audio/speech \
      -H "Authorization: Bearer your-api-key" \
      -H "Content-Type: application/json" \
      -d '{"input": "Hello world", "voice": "af_heart"}'

有关更多故障排除技巧,请参阅 音频故障排除指南

在 OpenWebUI 的对话中尽情体验自然的 AI 语音吧!

This content is for informational purposes only and does not constitute a warranty, guarantee, or contractual commitment. Open WebUI is provided "as is." See your license for applicable terms.