Ollama

概述

Open WebUI 可以帮您轻松连接和管理您的 Ollama 实例。本指南将引导您完成连接设置、模型管理，并帮助您快速开始使用。

面向协议的设计

Open WebUI 采用的是**面向协议（Protocol-Oriented）**的设计。这意味着当我们提到“Ollama”时，我们特指 Ollama API 协议（通常运行在 11434 端口）。

虽然某些工具可能只提供基础的兼容性，但此连接类型是专门针对 Ollama 服务的独特功能进行优化的，例如原生模型管理以及直接通过管理员 UI 拉取模型。

如果您的后端主要基于 OpenAI 标准（如 LocalAI 或 Docker Model Runner），为了获得最佳体验，我们建议您阅读兼容 OpenAI 的服务器指南。

步骤 1：设置 Ollama 连接

一旦 Open WebUI 安装并运行完毕，它会自动尝试连接到您的 Ollama 实例。如果一切顺利，您将能够立即管理并使用模型。

但是，如果您遇到连接问题，最常见的原因通常是网络配置错误。您可以参考我们的连接排错指南来寻求解决办法。

步骤 2：管理您的 Ollama 实例

要在 Open WebUI 中管理您的 Ollama 实例，请遵循以下步骤：

转到 Open WebUI 中的 管理员设置。
导航至 外部连接 > Ollama > 管理（点击扳手图标）。在此处，您可以下载模型、配置设置并管理与 Ollama 的连接。

连接建议

Docker 用户：如果 Ollama 运行在您的宿主机上，请使用 http://host.docker.internal:11434 作为连接 URL。
负载均衡：您可以添加多个 Ollama 实例。Open WebUI 将使用 随机选择 策略在它们之间分发请求，从而为并发用户提供基础的负载均衡。
- 注意：要启用此功能，请确保不同实例之间的 模型 ID 必须完全一致。如果您使用了 前缀 ID（Prefix ID），它们必须相同（或为空），以便模型可以合并为单个条目。

高级配置

前缀 ID (Prefix ID)：如果您有多个提供相同模型名称的 Ollama 实例，可以使用前缀（例如 remote/）以示区分。
模型 ID (过滤)：通过在此处列出特定模型 ID（白名单）来使其可见。留空将显示所有模型。

连接超时配置

当使用多个 Ollama 实例时（特别是在跨网络部署的情况下），如果某个端点不可达，可能会导致连接延迟。您可以通过以下设置来调节超时时间：

# 降低超时时间（默认是 10 秒）以加快故障转移
AIOHTTP_CLIENT_TIMEOUT_MODEL_LIST=3

如果您保存了一个无法访问的 URL 且无法打开设置来进行修复，请参阅模型列表加载问题故障排除指南。

下面是管理界面的外观示例：

Ollama Management Screen

快速高效下载模型的方法

如果您想要更快速地开始使用，可以直接从 模型选择器 下载模型。只需键入您想要下载的模型名称，如果该模型目前不可用，Open WebUI 将提示您从 Ollama 下载它。

下面是一个工作原理的示例：

Ollama Download Prompt

如果您想要跳过管理员设置菜单直接使用模型，这种方法是非常完美的。

卸载已加载的模型

对于目前被运行时保持活跃（Kept warm）的任何 Ollama 模型，Open WebUI 都会在模型选择器旁边显示一个绿色的 “Loaded” 指示器。管理员还可以在模型所在行看到一个 卸载（Eject） 按钮，以便在不重启服务器的情况下卸载它。在后台，Open WebUI 会调用 POST /api/models/unload（仅限管理员），该调用向提供该模型的所有 Ollama 节点转发一个 keep_alive=0 的生成请求。

这对于在交替使用多个大型模型时释放 GPU/VRAM，或在拉取新版本后强制重新加载非常有用。尝试卸载一个连接的提供商不支持卸载的模型会返回错误，而不是静默失败。

使用推理/思考（Reasoning / Thinking）模型

如果您正在使用像 DeepSeek-R1 或 Qwen3 这样在 <think>...</think> 标签中输出思考/推理内容的模型，您需要为 Ollama 配置 推理解析器 才能正确显示。

配置推理解析器

使用 --reasoning-parser 标志启动 Ollama：

ollama serve --reasoning-parser deepseek_r1

这可以确保思考内容与最终答案被正确分离，并在 Open WebUI 中以可折叠区域的形式显示。

提示

deepseek_r1 解析器适用于大多数推理模型，包括 Qwen3。如果遇到问题，请参见我们的推理与思考模型指南了解替代解析器和详细的排错步骤。

准备就绪！

大功告成！一旦您的连接配置完成且模型下载完毕，您就可以开始在 Open WebUI 中使用 Ollama 了。无论是探索新模型还是运行现有的模型，Open WebUI 都力求让一切变得简单且高效。

如果您遇到任何问题或需要更多指导，请查看我们的排错帮助部分以获取详细的解决方案。祝您使用 Ollama 愉快！ 🎉

This content is for informational purposes only and does not constitute a warranty, guarantee, or contractual commitment. Open WebUI is provided "as is." See your license for applicable terms.

概述​

面向协议的设计​

步骤 1：设置 Ollama 连接​

步骤 2：管理您的 Ollama 实例​

连接建议​

高级配置​

快速高效下载模型的方法​

卸载已加载的模型​

使用推理/思考（Reasoning / Thinking）模型​

配置推理解析器​

准备就绪！​

概述