JavaScript · 项目报告

Johell1NS/browser-search

A skill for AI agents: search the web with SearXNG, browse with Camofox, bypass protections with CloakBrowser. Anti-hallucination by design. Self-hosted, free, unlimited.

已完成 打开 GitHub
J
155星标
18Fork
0Issue
MIT许可证

分析结果

项目分析

browser-search 是一个面向 AI Agent 的“联网搜索与浏览技能包”,通过 SearXNG、Camofox 和 CloakBrowser 三个工具组合,让 Claude Code、OpenCode、Cursor、OpenClaw 等智能体能够先搜索、再浏览网页,并在遇到 Cloudflare、Akamai、DataDome 等反爬保护时自动升级到更隐蔽的浏览器方案。项目强调自托管、免费、无限制使用,以及通过“先检索、再回答”的流程降低 AI 幻觉。

适用领域 AI Agent 工具链 / 联网搜索 / 浏览器自动化 / 网页抓取 / Deep Research / 反爬绕过 / 自托管搜索引擎 / 开发者生产力工具
配置难度 中等偏高。会使用 npm、Docker、curl 和基本 Linux 命令的开发者可以安装运行;但要稳定用于生产或团队环境,需要理解浏览器自动化、反爬机制、代理配置、服务安全和 AI Agent 指令适配。
商业价值 未知
01

技术亮点

  • 组合了搜索、普通浏览和隐蔽浏览三层能力,而不是只提供单一爬虫或搜索接口
  • 完全自托管,无需购买搜索 API Key,也没有第三方 API 调用限制
  • 面向 AI Agent 设计,核心价值是让 Agent 知道何时搜索、何时浏览、何时升级反爬方案
  • SearXNG 负责快速元搜索,可同时聚合多个搜索源并返回 JSON 结果
  • Camofox 提供常驻浏览器 REST API,适合高频访问普通网页、提取内容和执行 JavaScript
  • CloakBrowser 作为兜底方案,用于处理 Cloudflare、Akamai、DataDome、Imperva、PerimeterX 等保护
  • 内置 Deep Research 思路,强调先搜索验证再回答,有助于减少 AI 编造信息
  • README 和技能文件可直接作为 Agent 指令模板,便于集成到不同 AI 编程工具
  • MIT 许可证,商业和个人项目使用门槛较低
  • 项目设计轻量,官方声称可在树莓派等低功耗设备上运行
02

目标用户

  • 使用 Claude Code、Cursor、OpenCode、OpenClaw 等 AI 编程/研究 Agent 的开发者
  • 需要让 AI Agent 访问实时网页信息的个人开发者和团队
  • 做 Deep Research、竞品分析、资料收集的研究人员
  • 需要自托管搜索与浏览能力的 AI 应用开发者
  • 需要抓取动态网页、JavaScript 渲染页面或受保护站点的工程师
  • 希望避免依赖付费搜索 API 或第三方浏览 API 的团队
03

配置要求

  • 需要 Node.js 和 npm,用于安装依赖和运行 CloakBrowser 相关脚本
  • 需要 Docker,用于运行 SearXNG 和 Camofox 服务
  • SearXNG 默认端口为 8080,需要确保 localhost:8080 可访问
  • Camofox 默认端口为 9377,需要确保 localhost:9377 可访问
  • CAMOFOX_API_KEY 用于 Camofox 的 evaluate、session、cleanup 等接口鉴权
  • CAMOFOX_ADMIN_KEY 用于 Camofox 的管理类接口,例如停止服务
  • 如需访问受地理位置限制或强反爬站点,可能需要配置代理,例如 socks5://...
  • 如果部署在服务器或内网环境,需要考虑端口暴露、防火墙、反向代理和访问控制
  • SKILL.md 默认偏 OpenCode 的 exec/curl 语法,其他 Agent 需要转换命令格式
  • CloakBrowser 基于 Playwright/Chromium,可能需要额外系统依赖和可用的图形/无头浏览器环境
04

适用场景

  • 为 AI Agent 增加实时 Web 搜索能力,避免模型只依赖训练数据回答
  • 让 Agent 自动搜索多个来源并打开结果页面进行事实核查
  • 搭建自托管 Deep Research 工作流,要求回答前必须引用实时网页信息
  • 抓取普通网页、文档站、新闻站、博客和产品页面内容
  • 处理需要 JavaScript 渲染、滚动、点击、执行脚本的网页
  • 在 Camofox 被反爬系统拦截时,自动切换到 CloakBrowser 访问受保护页面
  • 替代 SerpAPI、Browserless、Firecrawl 等部分付费服务的基础能力
  • 为企业内部 AI 助手提供可控、私有、低成本的联网浏览后端
05

部署与配置

  • 克隆仓库:git clone https://github.com/johell1ns/browser-search
  • 进入目录:cd browser-search
  • 安装 Node.js 依赖:npm install
  • 准备 Docker 环境,用于运行 SearXNG 和 Camofox
  • 根据 docker/setup.md 或官方文档启动 SearXNG,默认监听 localhost:8080
  • 根据 Camofox 文档启动 Camofox,默认监听 localhost:9377
  • 如系统缺少浏览器运行依赖,执行 scripts/setup-dependencies.sh
  • 配置必要环境变量,例如 CAMOFOX_API_KEY 和 CAMOFOX_ADMIN_KEY
  • 运行 scripts/check-browser-search.sh 检查服务是否正常
  • 让 AI Agent 阅读 SKILL.md,并根据所使用的 Agent 平台语法进行适配
06

风险与注意事项

  • 涉及反爬绕过和自动化访问受保护网站,使用时必须遵守目标网站服务条款、robots.txt、法律法规和数据合规要求
  • CloakBrowser、Camofox、SearXNG 都是外部组件,整体稳定性依赖多个上游项目
  • 反爬系统持续变化,当前可用的绕过能力未来可能失效
  • 自托管虽然免费,但需要用户自行维护 Docker、浏览器依赖、代理、端口和安全配置
  • 如果将服务暴露到公网,Camofox 等浏览器控制接口可能带来安全风险,必须做好鉴权和网络隔离
  • SearXNG 访问公共搜索引擎时可能遇到限流、封禁或结果不稳定
  • 对于大规模抓取任务,需要额外考虑代理池、限速、失败重试、数据去重和合规审计
  • 项目本身更像 Agent Skill 和编排模板,不是开箱即用的完整 SaaS 产品
  • README 中部分性能或绕过率数据来自外部来源,真实效果会受网络、目标站点和部署环境影响

历史记录

热榜历史快照

2026-06-25 第30名 新收录 · github_search