跳到主要内容

Ollama

概述

Open WebUI 可以帮您轻松连接和管理您的 Ollama 实例。本指南将引导您完成连接设置、模型管理,并帮助您快速开始使用。


面向协议的设计

Open WebUI 采用的是**面向协议(Protocol-Oriented)**的设计。这意味着当我们提到“Ollama”时,我们特指 Ollama API 协议(通常运行在 11434 端口)。

虽然某些工具可能只提供基础的兼容性,但此连接类型是专门针对 Ollama 服务的独特功能进行优化的,例如原生模型管理以及直接通过管理员 UI 拉取模型。

如果您的后端主要基于 OpenAI 标准(如 LocalAI 或 Docker Model Runner),为了获得最佳体验,我们建议您阅读 兼容 OpenAI 的服务器指南


步骤 1:设置 Ollama 连接

一旦 Open WebUI 安装并运行完毕,它会自动尝试连接到您的 Ollama 实例。如果一切顺利,您将能够立即管理并使用模型。

但是,如果您遇到连接问题,最常见的原因通常是网络配置错误。您可以参考我们的 连接排错指南 来寻求解决办法。


步骤 2:管理您的 Ollama 实例

要在 Open WebUI 中管理您的 Ollama 实例,请遵循以下步骤:

  1. 转到 Open WebUI 中的 管理员设置
  2. 导航至 外部连接 > Ollama > 管理(点击扳手图标)。 在此处,您可以下载模型、配置设置并管理与 Ollama 的连接。

连接建议

  • Docker 用户:如果 Ollama 运行在您的宿主机上,请使用 http://host.docker.internal:11434 作为连接 URL。
  • 负载均衡:您可以添加 多个 Ollama 实例。Open WebUI 将使用 随机选择 策略在它们之间分发请求,从而为并发用户提供基础的负载均衡。
    • 注意:要启用此功能,请确保不同实例之间的 模型 ID 必须完全一致。如果您使用了 前缀 ID(Prefix ID),它们必须相同(或为空),以便模型可以合并为单个条目。

高级配置

  • 前缀 ID (Prefix ID):如果您有多个提供相同模型名称的 Ollama 实例,可以使用前缀(例如 remote/)以示区分。
  • 模型 ID (过滤):通过在此处列出特定模型 ID(白名单)来使其可见。留空将显示所有模型。
连接超时配置

当使用多个 Ollama 实例时(特别是在跨网络部署的情况下),如果某个端点不可达,可能会导致连接延迟。您可以通过以下设置来调节超时时间:

# 降低超时时间(默认是 10 秒)以加快故障转移
AIOHTTP_CLIENT_TIMEOUT_MODEL_LIST=3

如果您保存了一个无法访问的 URL 且无法打开设置来进行修复,请参阅 模型列表加载问题 故障排除指南。

下面是管理界面的外观示例:

Ollama Management Screen

Ollama Management Screen

快速高效下载模型的方法

如果您想要更快速地开始使用,可以直接从 模型选择器 下载模型。只需键入您想要下载的模型名称,如果该模型目前不可用,Open WebUI 将提示您从 Ollama 下载它。

下面是一个工作原理的示例:

Ollama Download Prompt

如果您想要跳过管理员设置菜单直接使用模型,这种方法是非常完美的。


卸载已加载的模型

对于目前被运行时保持活跃(Kept warm)的任何 Ollama 模型,Open WebUI 都会在模型选择器旁边显示一个绿色的 “Loaded” 指示器。管理员还可以在模型所在行看到一个 卸载(Eject) 按钮,以便在不重启服务器的情况下卸载它。在后台,Open WebUI 会调用 POST /api/models/unload(仅限管理员),该调用向提供该模型的所有 Ollama 节点转发一个 keep_alive=0 的生成请求。

这对于在交替使用多个大型模型时释放 GPU/VRAM,或在拉取新版本后强制重新加载非常有用。尝试卸载一个连接的提供商不支持卸载的模型会返回错误,而不是静默失败。


使用推理/思考(Reasoning / Thinking)模型

如果您正在使用像 DeepSeek-R1Qwen3 这样在 <think>...</think> 标签中输出思考/推理内容的模型,您需要为 Ollama 配置 推理解析器 才能正确显示。

配置推理解析器

使用 --reasoning-parser 标志启动 Ollama:

ollama serve --reasoning-parser deepseek_r1

这可以确保思考内容与最终答案被正确分离,并在 Open WebUI 中以可折叠区域的形式显示。

提示

deepseek_r1 解析器适用于大多数推理模型,包括 Qwen3。如果遇到问题,请参见我们的 推理与思考模型指南 了解替代解析器和详细的排错步骤。


准备就绪!

大功告成!一旦您的连接配置完成且模型下载完毕,您就可以开始在 Open WebUI 中使用 Ollama 了。无论是探索新模型还是运行现有的模型,Open WebUI 都力求让一切变得简单且高效。

如果您遇到任何问题或需要更多指导,请查看我们的 排错帮助部分 以获取详细的解决方案。祝您使用 Ollama 愉快! 🎉

This content is for informational purposes only and does not constitute a warranty, guarantee, or contractual commitment. Open WebUI is provided "as is." See your license for applicable terms.