跳到主要内容

智能体网页搜索与 URL 抓取 🌐

Open WebUI 的网页搜索已从简单的结果注入演进为完全的智能体研究系统 (agentic research system)。通过启用 Native Function Calling(智能体模式/Agentic Mode),您可以让优秀的模型自主探索网页、验证事实并自动追踪链接。

需要优秀的模型支持

智能体网页搜索在诸如 GPT-5Claude 4.5+Gemini 3+MiniMax M2.5 等前沿模型上效果最佳,因为这些模型能够对搜索结果进行推理并决定何时深入挖掘。小型本地模型可能难以应付所需的多步推理。

中央工具文档说明

有关所有内置智能体工具(包括网页搜索、知识库、记忆等)的全面信息,请参见 原生/智能体模式工具指南

原生模式 vs. 传统 RAG

特性传统 RAG(默认)智能体搜索(原生模式)
搜索决策Open WebUI 根据提示词分析决定。模型自行决定是否以及何时需要进行搜索。
数据处理获取所有结果,对其进行分块并执行 RAG直接返回片段摘要 (Snippets);不进行分块,也不使用向量数据库 (Vector DB)。
链接追踪注入来自靠前结果的片段。模型使用 fetch_url 直接读取整页内容 (Full Page)
模型上下文仅获取相关片段(Top-K 分块)。通过 fetch_url 获取完整文本(最多约 5 万字符)。
推理机制模型在系统注入之后处理数据。模型可以搜索、阅读、校验并再次搜索。

如何启用智能体行为

要解锁这些功能,您的模型必须支持原生工具调用并具有强大的推理能力(例如 GPT-5、Claude 4.5 Sonnet、Gemini 3 Flash、MiniMax M2.5)。这些内置系统工具的管理员级配置是通过 中央工具调用指南 来处理的。

  1. 全局启用网页搜索:确保在 Admin Panel → Settings → Web Search 中配置了搜索引擎。
  2. 启用模型能力:在 Admin Panel → Settings → Models 中,选择您的模型并启用 Web Search 能力。
  3. 启用默认功能:在相同的模型设置中,在 Default Features 下勾选 Web Search。这控制了 search_web and fetch_url 工具是否在新的聊天会话中默认可用。
  4. 启用原生模式(智能体模式)
    • 在相同的模型设置中,在 Advanced Parameters 下将 Function Calling 设置为 Native
  5. 使用优秀的模型:确保您使用的是具有强大推理能力的前沿模型,以获得最佳效果。
模型能力、默认功能与聊天开关

Native Mode(支持的模式)下,search_webfetch_url 工具需要同时满足模型设置中的 Web Search 能力已被启用,Default Features 下勾选了 Web Search(或在聊天中手动开启)。如果缺少其中任何一项,这些工具就不会被注入 —— 尽管其他内置工具可能仍会出现。

在此提及 Default 模式的 RAG 风格注入行为仅供遗留部署参考。Default 模式已不再受支持,所有模型都应配置为 Native 模式。

重要提示:如果您在模型上禁用了 web_search 能力但使用了 Native 模式,即使您在聊天中手动开启网页搜索,这些工具依然不可用。

原生工具如何处理数据(智能体模式)

🔗 必须理解,Native 模式(智能体模式)的工作原理与标准模型中全局的“Web Search”开关有着根本性的不同。

search_web(仅限网页片段摘要)

当模型调用 search_web 时:

  • 动作:它向您的搜索引擎查询并接收一系列标题、链接和片段摘要 (snippets)。
  • 返回结果数量行为:如果模型省略了 count 参数,Open WebUI 将使用管理员配置的 WEB_SEARCH_RESULT_COUNT。如果模型提供了 count,该值将被限制在相同的管理员最大值内。
  • 无 RAG 过程:与传统搜索不同,没有任何数据被存储在向量数据库 (Vector DB) 中。不进行任何分块 (chunking) 或嵌入 (embedding)。
  • 返回结果:模型看到的内容与人类在搜索结果页面上看到的内容完全一致。如果片段摘要中已包含答案,模型就会直接做出回复。如果未包含,模型必须决定是否需要“深挖”某个链接。

fetch_url(整页上下文内容)

如果模型判定搜索摘要信息不足,它会调用 fetch_url

  • 直接访问:该工具会访问特定的 URL,并使用您配置的 Web Loader 提取其正文。
  • 原始上下文:提取的文本将直接注入到模型的上下文窗口中(出于防止上下文溢出的考虑,会在恰好 50,000 个字符处执行硬编码截断)。
  • 智能体优势:由于不使用 RAG,模型拥有该页面的“全貌”而不是零散的碎片。这使得它能够在特定页面上执行复杂的指令(例如,“总结此文档链接中的技术规范表格”)。
提示

通过保持 search_webfetch_url 相互独立且免去 RAG 环节,模型成为了自己专属的信息检索 (Information Retrieval) 智能体,可以自主精准地选择哪些源文件值得通篇阅读。

深度研究与交织思维 🧠

由于模型可以多次调用 search_web 并自主决定何时深入挖掘,因此它可以通过 交织思维 (Interleaved Thinking) 来执行真正的“深度研究”。这构建了一个强大的研究闭环,使模型能够充当自己的研究助手。

交织思维的工作原理

交织思维是指模型在推理 (reasoning)行动 (action) 之间持续循环切换的能力。模型不再是仅进行单次搜索便做出回答,而是可以:

📖 详细的研究循环示例

用户提问:“React 生态系统中有哪些最新的安全漏洞?”

第 1 步:初始分析 🤔

  • 模型思考:“我需要关于 React 安全的最新信息。让我先进行一次宽泛的搜索。”

第 2 步:首次搜索 🔍

模型调用:search_web("React security vulnerabilities 2026")
  • 接收基于管理员配置的 WEB_SEARCH_RESULT_COUNT(或模型提供的较小 count 值)的片段摘要。
  • 看到指向 npm 软件包和 CVE 数据库的参考引用。

第 3 步:信息缺口分析 🤔

  • 模型思考:“片段摘要中提到了 CVE,但细节不够。我应该去抓取特定的安全公告页面。”

第 4 步:针对性抓取 📄

模型调用:fetch_url("https://example.com/react-security-advisory-2026")
  • 读取详细安全文档中完整的 5 万字符。
  • 确定具体的漏洞类型(XSS、注入等)。

第 5 步:细化研究 🤔

  • 模型思考:“我找到了服务端漏洞。让我专门搜索一下客户端问题。”

第 6 步:细化搜索 🔍

模型调用:search_web("React client-side XSS CVE 2026")
  • 获取有关跨站脚本 (XSS) 问题的更具体结果。
  • 确定缓解策略。

第 7 步:综合分析 🤔

  • 模型思考:“我目前已经拥有来自多个权威来源的全面信息。是时候进行综合了。”

第 8 步:最终答案 ✅

  • 提供引用了多个来源的详细且有据可查的回复。
  • 包含具体的 CVE 编号、受影响的版本以及缓解步骤。

智能体研究循环

模型会在此类阶段中持续循环,直到拥有足够的信息:

  1. 🤔 思考 (THINK):分析当前的知识缺口,并确定缺失了什么信息。
  2. 🔍 行动 (ACT):搜索网页或抓取特定 URL,以收集相关内容。
  3. 📊 评估 (EVALUATE):评估所获取信息的质量和完整性。
  4. ❓ 决策 (DECIDE):确定是否需要进行更多研究,或者是否已经收集了足够的上下文。
  5. 🔄 迭代 (ITERATE):如果仍存在缺口,则带着更精准的焦点和更具体的查询回到步骤 1。
  6. ✅ 综合 (SYNTHESIZE):一旦收集到足够的信息,便编译并呈现最终的解答。

该循环会自动重复,直到模型获得全面且经核实的信息,以高度确信地回答您的问题。

关键优势

🎯 自适应精度 (Adaptive Precision):模型不仅仅是搜索一次然后接受弹出的任何结果。相反,它会根据所发现的内容不断细化其搜索策略。如果最初的宽泛搜索返回的是表层信息,模型会自动转向更具体的专业术语、产品名称、版本号或特定词汇。每一次迭代都会变得越来越有针对性,从通用概念逐步深挖到具体细节,以确保最终答案既全面又精准。

🔗 深度链接追踪与探索 (Deep Link Following & Discovery):与仅使用搜索结果片段的传统 RAG 系统不同,模型在片段摘要不足时可以阅读整页内容。更强大的是,当模型使用 fetch_url 阅读页面时,它可以发现并追踪该内容中提及的新 URL。例如,如果抓取到的页面引用了某份技术规范文档、官方变更日志 (changelog) 或相关的研究论文,模型可以自动再次对这些发现的 URL 调用 fetch_url 以进行更深入的探究。这创造了自然的“网页浏览”行为,模型跟随引用链条、探索链接资源,并通过阅读多个互相关联的源文件来建立全面的理解 —— 就像人类研究员所做的那样。

✅ 事实验证与交叉引用 (Fact Verification & Cross-Referencing):模型可以通过交叉引用多个独立的来源来自动验证信息。如果某个来源提出了某项主张,模型可以搜索来自权威来源的佐证,在官方文档中比对版本号,或向主要来源证实事实。这种多源验证显著减少了幻觉 (hallucination) 并提高了答案的可靠性,因为模型能通过在不同的可信来源之间找到一致的信息来建立确信度。

🧩 智能补全缺口 (Intelligent Gap Filling):如果初步的搜索结果遗漏了关键信息或仅部分解答了问题,模型会识别出这些缺口,并自动使用不同的术语、替代性表达或更具体的查询开展后续搜索。例如,如果搜索“React 性能问题”没有产生关于特定优化技术的信息,模型可能会将搜索精细化为“React useMemo 优化”或“React.memo vs useMemo 比较”来填补该知识缺口。这确保了对可能需要多个搜索角度的复杂主题的全面覆盖。

🌐 多源综合 (Multi-Source Synthesis):模型不仅会返回单一来源的信息 —— 它还能将来自多个网页、文档网站、论坛和文章的见解综合为一个通顺、全面的回答。相比任何单一来源,这种综合分析能提供更广泛的上下文、吸纳不同的视角并呈现更完整的全貌。

📚 感知上下文的源文件选择 (Context-Aware Source Selection):模型能智能地决定是依赖搜索片段摘要(在其包含足够信息时),还是去抓取整页内容(在需要更深层次的细节时)。它还能确定何时应当停止 research —— 从而在确保彻底性的同时,避免产生不必要的工具调用。这种在效率和全面性之间的平衡使得智能体搜索既快速又可靠。

这种 Thought(思考)→ Action(行动)→ Thought(思考) 的迭代闭环将不断持续,直到模型拥有足够的信息以最高准确度回答您的请求。

了解更多关于交织思维的信息

欲了解关于交织思维如何在所有智能体工具(不仅限于网页搜索)中工作的更多详情,请参见 交织思维指南

下一步

This content is for informational purposes only and does not constitute a warranty, guarantee, or contractual commitment. Open WebUI is provided "as is." See your license for applicable terms.