Documentation Index
Fetch the complete documentation index at: https://openclaw.zhcndoc.com/llms.txt
Use this file to discover all available pages before exploring further.
web_fetch 工具会执行普通的 HTTP GET 并提取可读内容
(HTML 转 markdown 或文本)。它不会执行 JavaScript。
对于重度依赖 JS 的站点或受登录保护的页面,请改用
Web Browser。
快速开始
web_fetch 默认已启用——无需任何配置。代理可以
立即调用它:
工具参数
要获取的 URL。仅支持
http(s)。主内容提取后的输出格式。
将输出截断到这么多字符。
工作原理
配置
Firecrawl 回退
如果 Readability 提取失败,web_fetch 可以回退到
Firecrawl,以实现反机器人绕过和更好的提取:
plugins.entries.firecrawl.config.webFetch.apiKey 支持 SecretRef 对象。
旧版 tools.web.fetch.firecrawl.* 配置会通过 openclaw doctor --fix 自动迁移。
如果 Firecrawl 已启用,但其 SecretRef 未解析且没有
FIRECRAWL_API_KEY 环境变量回退,网关启动将快速失败。Firecrawl
baseUrl 覆盖已被锁定:托管流量使用
https://api.firecrawl.dev;自托管覆盖必须指向私有或
内部端点,并且仅对这些私有目标接受 http://。tools.web.fetch.provider明确选择抓取回退提供方。- 如果省略
provider,OpenClaw 会根据可用凭据自动检测第一个就绪的 web-fetch 提供方。非沙箱化的web_fetch可以使用声明了contracts.webFetchProviders的 已安装插件,并在运行时注册匹配的提供方。当前捆绑的提供方是 Firecrawl。 - 沙箱化的
web_fetch调用仍仅限于捆绑提供方。 - 如果禁用了 Readability,
web_fetch会直接跳到所选 提供方回退。如果没有可用提供方,则会安全失败。
受信任的环境代理
如果你的部署要求web_fetch 通过受信任的外部
HTTP(S) 代理,请设置 tools.web.fetch.useTrustedEnvProxy: true。
在此模式下,OpenClaw 在发送请求前仍会应用基于主机名的 SSRF 检查,
但它会让代理解析 DNS,而不是在本地进行 DNS 固定。仅当代理由操作员控制,
并且在 DNS 解析后强制执行外发策略时才启用此功能。
如果未配置 HTTP(S) 代理环境变量,或者目标主机被
NO_PROXY 排除,web_fetch 将回退到带本地 DNS
固定的正常严格路径。限制与安全
maxChars会被限制为tools.web.fetch.maxCharsCap- 在解析前,响应正文会被限制为
maxResponseBytes;超大 响应会带警告地截断 - 私有/内部主机名会被阻止
tools.web.fetch.ssrfPolicy.allowRfc2544BenchmarkRange和tools.web.fetch.ssrfPolicy.allowIpv6UniqueLocalRange是针对受信任假 IP 代理栈的 细粒度可选项;除非你的代理拥有这些合成范围并强制执行其自身的目标策略,否则请保持未设置- 重定向会被检查并受
maxRedirects限制 useTrustedEnvProxy是显式可选启用项,并且仅应为仍在 DNS 解析后强制执行外发策略的、由操作员控制的代理启用web_fetch尽力而为——某些站点需要 Web Browser
工具配置文件
如果你使用工具配置文件或允许列表,请添加web_fetch 或 group:web:
相关内容
- Web Search — 使用多个提供方搜索网页
- Web Browser — 面向重 JS 站点的完整浏览器自动化
- Firecrawl — Firecrawl 搜索和抓取工具