Open Responses
概述
Open WebUI 对 Open Responses 具有实验性支持,这是一个用于多提供商、可互操作 LLM 接口的开放规范。本指南将引导您为连接启用 Open Responses API。
此功能目前处于实验阶段,可能无法在所有提供商中按预期工作。
什么是 Open Responses?
Open Responses 是一个开源规范,用于标准化不同提供商之间的 LLM 请求和响应结构。它提供:
- 一个规范,多个提供商:只需描述一次输入/输出;即可在 OpenAI、Anthropic、Gemini 或本地模型上运行。
- 可组合的智能体循环(Agentic loops):统一的流式传输、工具调用和消息编排。
- 更容易进行评估和路由:通过共享模式(Schema)对比提供商、路由请求和记录结果。
Open Responses 基于 OpenAI Responses API 格式构建,但旨在适用于任何实现了该规范的提供商。
步骤 1:添加或编辑连接
- 转到 ⚙️ 管理员设置。
- 导航至 外部连接 > OpenAI > 管理(查找扳手图标)。
- 点击 ➕ 添加新连接 或编辑现有连接。
步骤 2:选择 API 类型
在连接弹窗中,找到 API 类型 (API Type) 设置:
- Chat Completions(默认):使用标准的 OpenAI Chat Completions API 格式。
- Responses(实验性):使用 Open Responses API 格式。
点击开关切换到 Responses。您将看到一个“Experimental”(实验性)标签,表明该功能仍处于开发阶段。

步骤 3:配置您的提供商
输入支持 Open Responses 格式的提供商的连接详细信息:
- URL:您提供商的 API 端点
- API Key:您的身份验证凭证
- 模型 ID:(可选)指定要使用的特定模型
支持的提供商
Open Responses 是一个全新的规范,因此提供商的支持仍在增长中。有关最新的符合规范的提供商和实现列表,请查看 Open Responses 官方网站。
故障排除
连接在 Chat Completions 下工作,但在 Responses 下不工作
目前并非所有提供商都支持 Open Responses 格式。请尝试:
- 切换回 Chat Completions
- 检查您的提供商是否显式支持 Open Responses
- 使用可以转换为 Open Responses 格式的中间件代理(Middleware Proxy)
流式传输或工具调用表现异常
Responses API 连接支持工具调用、重新调用和流式传输。Open WebUI 会在 Chat Completions 和 Responses API 格式之间进行透明的转换,包括工具调用参数、函数调用输出以及多轮工具使用。如果您依然遇到问题:
- 在 Open WebUI Discord 中查找已知问题
- 在 GitHub 上提交 Bug 报告
有状态会话(Stateful sessions)
默认情况下,Open WebUI 将 Responses API 连接视为无状态——它会在本地 管理对话历史记录,并在每次请求时发送完整的上下文。如果您的上游提供商支持有状态会话(使用 previous_response_id 锚定的服务器端响应存储,例如直接连接 OpenAI),您可以启用 ENABLE_RESPONSES_API_STATEFUL=true,让提供商来管理对话状态。
大多数代理和第三方 Responses API 端点是无状态的,如果启用有状态模式可能会导致其崩溃。请仅在提供商显式支持有状态 Responses API 会话时使用此功能。
了解更多
- Open Responses 规范:完整的技术规范
- Open Responses GitHub:源代码与讨论
- FAQ:为什么 Open WebUI 不原生支持专有 API?:了解我们“面向协议优先”的哲学理念