🤖 Models 模型
为任何底座模型封装自定义指令、工具与知识库,打造专属的智能代理(Agents)。
模型 (Models)工作区允许您在任何基础模型(base model)之上创建配置预设(presets)。选择 GPT-4o、Claude、Llama 3 或任何其他已连接到 Open WebUI 的模型,然后将系统提示词、知识库、工具、技能和参数覆写绑定到它上面。这样生成的产品就是一个专属定制的智能代理,它能完全按照您的业务需求行事,而无需修改底层模型的任何参数。
一个始终遵循您的风格指南的“Python 导师”;一个采用您公司模板的“会议摘要生成器”;一个内置了您的 Lint 校验规则的“代码审查器”。每一个智能代理都只是一个轻量级的包装:选择底座模型,进行个性化配置,然后一键共享给您的团队。
为什么选择 Models?
一个基础模型,多种人设角色
同一个 GPT-4o 模型可以同时驱动编程助手、客户支持机器人和创意写作助理。每个预设(preset)都拥有自己独立的系统提示词、工具和知识库,因此模型的行为模式将根据您选择的预设而截然不同。
预绑定知识库与工具
无需在每次开启新聊天时都繁琐地手动绑定文档和启用工具,您只需在模型预设中完成一次性绑定即可。用户打开时就是一个开箱即用、配置齐全的智能代理。
细粒度的权限控制
限制模型仅对特定的用户或用户组可见。财务团队只能看到财务模型;研发团队只能看到研发模型。管理员可以全局管控整个实例内所有模型的可用状态。
动态系统提示词
支持使用 Jinja2 风格的变量(如 {{ USER_NAME }} 和 {{ CURRENT_DATE }}),从而让系统提示词(system prompt)能够自动感知和适配当前用户与当前会话的上下文环境。
核心功能
| 🧩 模型预设 (Presets) | 将系统提示词、工具、知识库、技能与参数一键打包封装 |
| 🏷️ 动态变量 | 自动注入 {{ USER_NAME }}、{{ CURRENT_DATE }}、{{ CURRENT_TIME }} |
| 🔧 绑定的工具 | 按模型强制启用特定的工具 |
| 📚 绑定的知识库 | 通过 RAG 或完整上下文模式让知识库和文件随时可用 |
| 🎭 技能 | 绑定 Markdown 指令集,通过 view_skill 按需加载 |
| 👥 访问控制 | 限制仅特定的用户或用户组可见/可用 |
| 📊 全局默认值 | 一次性为所有模型配置基础能力与推理参数 |
| 🔊 单模型专属 TTS 语音 | 为每个角色赋予专属的播报语音 |
创建模型
在 Workspace > Models 中点击 + New Model,或在已有模型上点击省略号(...)并选择 Edit(编辑)。
核心配置
| 字段 | 描述 |
|---|---|
| Avatar | 上传自定义头像。支持动图 GIF 和 WebP 格式 |
| Name and ID | 模型的显示名称与全局唯一标识符 |
| Base Model | 驱动该智能代理的底层物理底座模型 |
| Description | 在模型选择器下拉列表中展示的简短概述 |
| Tags | 对下拉列表中的模型进行标签化分类整理 |
| Visibility | 设置为私有(仅限特定用户/用户组)或全员公开 |
系统提示词与变量
系统提示词(system prompt)用于定义 AI 的行为模式和角色人设。可以使用动态变量来实现上下文感知指令:
| 变量 | 输出示例 |
|---|---|
{{ CURRENT_DATE }} | 2024-10-27 |
{{ CURRENT_TIME }} | 14:30:05 |
{{ USER_NAME }} | Admin |
{{ USER_GROUPS }} | Engineering, Beta Testers(逗号分隔;若用户不属于任何组则为空) |
You are a helpful assistant for {{ USER_NAME }}.
The current date is {{ CURRENT_DATE }}.
{{ USER_GROUPS }} 使得单个共享模型可以根据调用者的 RBAC 用户组来自主调整其行为模式 —— 例如:“只有在 {{ USER_GROUPS }} 包含 'Engineering' 时,您才可以讨论内部路线图细节。” 占位符在聊天时的服务器端进行实时解析,且只有在模板中实际引用了该变量时,才会触发数据库查询。
能力与绑定项目
开启或关闭模型可以执行的操作,并绑定相关资源:
| 设置 | 控制的内容 |
|---|---|
| Knowledge | 绑定集合或文件。点击附加的项可在 Focused Retrieval(专注检索)与 Full Context(完整上下文)之间进行切换。参见检索模式 |
| Tools | 强制启用特定工具(例如,为数学助手强制启用 Calculator 工具) |
| Skills | 绑定 Skills(技能),以便始终注入其清单 |
| Filters | 附加管道过滤器(例如,个人隐私信息 PII 脱敏处理) |
| Actions | 附加动作脚本(例如,“添加到记忆中”) |
| Vision | 启用图像分析(底座模型需具备视觉处理能力) |
| Web Search | 开启配置好的网页搜索提供商 |
| Code Interpreter | 开启 Python 代码执行能力 |
| Image Generation | 开启图像生成能力 |
| Builtin Tools | 控制哪些内置工具分类可用:Time、Memory、Chats、Notes、Knowledge、Channels、Task Management、Automations |
| File Context | 启用时,附加的文件将通过 RAG 管道进行处理。禁用时,不提取任何文件内容 |
| TTS Voice | 为该模型的回复设置特定的 TTS 语音 |
高级参数
- Stop Sequences(停止序列):强制在特定字符串(例如
<|end_of_text|>、User:)出现时终止生成。每个序列输入后按 Enter 回车。 - Temperature、Top P 等:调节模型的创造力和确定性。
提示词建议
当用户使用该模型开启全新聊天时,会显示可点击的快捷提示卡片。添加诸如“请逐步解释这段代码”或“请总结这份文件”等短语,以引导用户进行提问。
模型管理
在模型列表中,点击任何模型旁边的省略号(...):
| 操作 | 描述 |
|---|---|
| Edit | 打开配置面板 |
| Hide | 从模型选择器下拉列表中隐藏,而不彻底删除 |
| Clone | 复制该模型配置(克隆版名称会自动附带 -clone 后缀) |
| Copy Link | 复制指向该模型设置界面的直接 URL 链接 |
| Export | 将模型配置下载为 .json 文件 |
| Share | 共享到 Open WebUI 社区 |
| Delete | 永久删除该模型预设 |
导入与导出
- 导入:支持从
.json文件或 Open WebUI 社区链接进行导入 - 导出:将所有自定义模型的配置一键导出为一个
.json文件 - 探索:在页面底部浏览社区提供的各种优秀预设
要下载新的底层 base 模型,转到 Settings > Connections > Ollama,或在模型选择器中直接输入 ollama run hf.co/{username}/{repository}:{quantization}。
全局模型默认值(管理员)
管理员可以通过 Admin Panel > Settings > Models > ⚙️(齿轮图标) 来设定适用于所有模型的基础能力和底线推理参数。
- Default Model Metadata (
DEFAULT_MODEL_METADATA):基础能力默认开启状态(视觉、网页搜索、文件上下文、代码解释器、内置工具)。在发生冲突时,单模型的个性化覆写设置始终优先。 - Default Model Params (
DEFAULT_MODEL_PARAMS):底线推理参数(temperature、top_p、max_tokens、function_calling)。当单模型显式设定了参数时,以单模型的设定值为准。该默认值从环境中作为 JSON 加载;如果 JSON 格式无效将被忽略并回退为{}。
合并行为
| 设置类型 | 合并策略 | 示例 |
|---|---|---|
| Capabilities(能力) | 深度合并(Deep merge) | 全局设置 file_context: false,模型设置 vision: true > 模型最终同时获得这两项配置 |
| 其他元数据 | 仅填充空白(Fill-only) | 全局设置了描述,模型没有配置描述 > 模型继承全局描述内容 |
| 推理参数 | 简单合并(Simple merge) | 全局设置 temperature: 0.7,模型设置 0.3 > 模型最终生效 0.3 |
在全局参数中设置 function_calling: native 会彻底改变所有模型处理已绑定知识库的方式。在原生模式下,模型绑定的知识库不会被自动注入。模型必须自主调用内置工具来检索知识。如果您的知识库突然停止工作,请优先检查此全局默认值。
详情请参阅 知识库排查指南。
批量管理
可以通过状态过滤管理员模型列表(Enabled、Disabled、Visible、Hidden),并使用 Bulk Actions(批量操作)一键启用或禁用当前视图下的所有模型。当外部服务提供商向您暴露了数百个模型时,此项功能极具实用价值。
聊天中的模型切换
支持在对话中途直接切换模型,而不会丢失任何历史上下文。您最多可以同时选择两个模型来并排(side-by-side)对比它们的回复,并使用方向键在它们之间来回穿梭。
使用场景
团队专属智能代理
创建一个绑定了销售团队 CRM 知识库、反对意见应答提示词和邮件起草工具的“销售助理”模型。将其共享给销售用户组。研发人员完全不会看到该模型。
新员工入职引导
为模型配置具有描述性的提示卡片建议(例如“向我提问关于公司福利政策的问题”、“帮我搭建本地开发环境”),使新入职的团队成员准确知道如何向 AI 提问。
强制推行组织标准
通过配置全局默认值,在所有模型中统一禁用代码解释器、强制设定统一的温度参数、或者强制要求使用函数调用。个别模型在确有需要时可自行进行个性化覆写。
局限性
仅为预设,而非微调
模型预设通过系统提示词和工具绑定来塑造和规范 AI 的行为。它们不会改变底层底座模型的权重参数。要想实现深刻的行为逻辑转变,您依然需要进行真实的模型微调(fine-tuning)。
故障转移(Fallback)需要显式配置
如果某个底座模型突然不可用,该预设模型也将失效,除非管理员在 Admin Panel > Settings > Models 中将 ENABLE_CUSTOM_MODEL_FALLBACK 开启为 True,并配置了备用的默认模型。