多模型对话
Open WebUI 允许您在单个对话界面中同时与多个模型交互。这一强大的功能使您能够并排对比回复、验证事实并发挥不同 LLMs 的独特优势。
概述
在多模型对话中,您的 Prompt 会被同时发送给两个或多个选定的模型。它们的回复将以并排的列(或堆叠的形式,取决于屏幕大小)呈现,让您直观地了解不同的 AI 架构在处理同一个问题时的表现。
如何使用
- 选择模型:在对话顶栏(模型选择器)中,点击 +( 加号) 按钮为当前的会话添加更多模型。
- 示例配置:选择 GPT-5.1 Thinking(用于深度推理)、Gemini 3(用于创意写作)和 Claude Sonnet 4.5(用于综合性能)。
- 发送 Prompt:像往常一样输入您的问题。
- 查看结果:观察所有模型在对话窗口中同步生成各自的回复。
使用场景
- 模型对比与评测:测试哪种模型编写的 Python 代码更好,或者哪种模型在小众专业话题上产生的幻觉较少。
- 事实交叉验证:对模型进行“对质”。如果两个模型说 X,而另一个说 Y,您可以进一步调查原因。
- 多元化视角:在同一个查询中,让一个模型给出“创意”视角,而另一个模型提供“技术”维度的视角。
权限设置
管理员可以按角色或群组控制对多模型对话的访问权限。
- 位置:管理员面板 > 设置 > 通用 > 用户权限 > 对话 > 多个模型 (Admin Panel > Settings > General > User Permissions > Chat > Multiple Models)
- 环境变量:
USER_PERMISSIONS_CHAT_MULTIPLE_MODELS(默认值:True)
如果禁用,用户在模型选择器中将看不到“加号 ”按钮,并且无法启动多模型对话会话。
合并回复(Mixture of Agents - 混合专家代理)
当您获得多个模型的回复后,Open WebUI 还提供了一项高级功能,即可以将它们合并为一个更优的最终答案。这实现了一个 Mixture of Agents (MOA) 的工作流程。
什么是合并?
合并操作会收集您所有活动模型的输出,并将这些输出连同您的原始 Prompt 一起发送给一个“合成器模型(Synthesizer Model)”。该合成器模型会阅读所有草稿答案,并将它们整合成一个最终的、润色后的高质量回复。
如何进行合并
- 启动 多模型对话 并获取所选模型的回复。
- 在回复控制区域(通常在重新生成按钮附近)找到 合并(Merge)(或“合成(Synthesize)”)按钮。
- Open WebUI 将生成一个全新的回复,聚合之前输出的最佳部分。
合并的优势
- 更高的准确性:研究表明,汇总多个模型的输出通常比单个模型独立运行的表现更好。
- 强强联合:您可以将模型 A 的代码准确性与模型 B 的清晰解释融合在一起。
- 减少幻觉:合成器模型可以过滤掉单个回复中出现的不一致和错误。
配置说明
合并过程依赖于后端的 任务(Tasks) 系统。
- 任务模型 (Task Model):用于执行合并的具体模型可以在 管理员面板 > 设置 > 任务 (Admin Panel > Settings > Tasks) 中进行配置。为了获得最佳效果,我们推荐使用能力较强的模型(如 GPT-5.1 或 Claude Sonnet 4.5)作为任务模型。
- Prompt 模板:系统使用专门的 Prompt 模板来指导 AI 如何整合并合成答案。
实验性功能
合并/MOA 功能是一项高级特性。虽然功能强大,但需要一个能力优秀的 Task Model 才能发挥最佳作用。