如果你经常需要重复刷网页、整理信息,又不想花大价钱用付费工具,那这个叫 Nanobrowser 的浏览器插件可能正好适合你。它是一个能靠 AI 自动完成网页操作的开源工具,就像给浏览器配了个 “智能助手”,而且完全免费,还能自己选喜欢的 AI 模型来用。
一、项目简介:它到底是个啥?
Nanobrowser 本质是个 Chrome/Edge 浏览器插件,主打 “AI 网页自动化”—— 简单说,你不用手动点网页、复制粘贴,只要跟它说清楚需求(比如 “找亚马逊上 50 美元以内的防水蓝牙音箱”),它就能自动帮你完成浏览、筛选、整理信息的工作。
它最核心的定位是 OpenAI Operator 的免费替代方案(OpenAI Operator 每月要 200 美元,普通人很难承受)。但它不止是 “平替”,还多了不少灵活度:比如支持多种 AI 模型、所有操作都在你自己的浏览器里跑,不会把你的账号密码、浏览数据传到别人的服务器上,隐私性更有保障。
另外,它是完全开源的,代码都放在 GitHub 上,你能看到它到底是怎么工作的,不用担心有隐藏功能或者后门。
二、核心功能:它能帮你做什么?
1. 多 AI 协作的 “分工系统”
它不是靠一个 AI 干所有活,而是分了 3 个 “小助手”(Planner、Navigator、Validator)协同工作:
- Planner(规划员):负责想方案。比如你让它 “整理 TechCrunch 近 24 小时的 10 条头条”,它会先拆解步骤:先打开 TechCrunch 官网、找到 “最新文章” 板块、筛选时间范围、提取标题…… 如果中间遇到问题(比如网页布局变了),它还会自己调整方案。
- Navigator(导航员):负责执行操作。按照 Planner 的步骤,自动点网页按钮、输入文字、滚动页面,就像有人在帮你手动操作,但速度更快。
- Validator(验证员):负责检查结果。比如提取完头条后,它会核对 “是不是 10 条”“时间是不是在 24 小时内”,确保没出错。
你还能给每个 “小助手” 配不同的 AI 模型 —— 比如让擅长思考的模型做 Planner,让速度快、成本低的模型做 Navigator,平衡效果和花费。
2. 灵活的 AI 模型选择
不像很多工具只能用固定的 AI,它支持超多主流 AI 服务商,你只要填自己的 api 密钥就能用:
- 常用的云端模型:OpenAI(GPT 系列)、Anthropic(Claude 系列)、Google Gemini、Groq、Cerebras 等;
- 本地模型:如果你不想用云端(怕数据泄露、想省 API 钱),可以用 Ollama 这类工具在自己电脑上跑模型(比如 Qwen3 14B、Mistral Small 24B),完全不用连外网。
3. 实用的交互功能
- 侧边栏聊天界面:操作很简单,点浏览器工具栏的 Nanobrowser 图标,就能打开聊天框,直接用自然语言说需求(不用学代码),还能实时看到它的操作进度。
- 历史记录回溯:之前让它做过的任务(比如上周找的 GitHub 热门 Python 仓库),能随时调出来看,还能让它重复之前的操作(比如 “再按上次的条件找一遍最新的仓库”)。
- 追问功能:比如它帮你找完音箱后,你可以接着问 “把这些音箱按电池续航排序”,它会基于之前的结果继续处理,不用重新说一遍需求。
4. 隐私和成本可控
- 本地运行:所有操作、数据都在你自己的浏览器里处理,你的账号密码、浏览记录不会传到任何云端,不用担心泄露。
- 成本自己定:它本身完全免费,你只用为自己的 AI API 付费(比如用 GPT-4o-mini 这类低成本模型,一次简单任务可能就几毛钱),不想花钱就用本地模型,零成本。
三、支持的浏览器
- 完全能用的:Chrome、Edge(这两个是官方推荐的,所有功能都能正常用);
- 暂时不能用的:Firefox、Safari,还有 Opera、Arc 这类基于 Chromium 的浏览器(虽然可能能装,但容易出 bug,不推荐)。
四、应用场景:哪些时候用它最方便?
1. 信息整理类
- 自动提取新闻、博客的关键信息(比如 “提取 36 氪今天的 AI 相关文章摘要”);
- 汇总数据(比如 “找知乎‘程序员薪资’话题下的 10 条高赞回答,整理成表格”)。
2. 平台调研类
- GitHub 找项目:“找最近 30 天星标最多的 5 个 Python 自动化工具仓库,附简介”;
- 电商比价:“在京东、淘宝找 1000 元以内的无线耳机,筛选支持主动降噪的,按好评率排序”。
3. 重复操作类
- 定时任务:“每天早上 9 点打开公司考勤系统,自动填打卡备注”(需要配合定时工具);
- 批量操作:“在豆瓣电影里,把‘想看’列表里的电影,按评分从高到低整理成文档”。
五、怎么用它?
1. 简单版:从应用商店装(适合小白)
- 打开 Chrome 或 Edge 的应用商店,搜 “Nanobrowser”;
- 点 “添加到浏览器”,确认安装;
- 装完后点工具栏的 Nanobrowser 图标,打开设置,填自己的 AI API 密钥,选好模型(比如 Planner 用 Claude 3.5 Sonnet,Navigator 用 GPT-4o-mini),就能开始用了。
2. 进阶版:装最新版(想要尝鲜新功能)
有时候应用商店的版本会滞后,想玩最新功能可以手动装:
- 去它的 GitHub release 页面(点项目主页的 “Releases”),下载最新的 “nanobrowser.zip” 压缩包;
- 解压压缩包;
- 打开 Chrome/Edge 的 “扩展程序” 页面(地址栏输 chrome://extensions/),右上角打开 “开发者模式”;
- 点 “加载已解压的扩展程序”,选刚才解压的文件夹,就装好了。
3. 高手版:自己从代码编译(想改功能)
如果懂点编程,想自己改代码(比如加个新的 AI 模型支持),可以自己编译:
- 先装 Node.js(v22.12.0 以上)和 pnpm(v9.15.1 以上);
- 用 Git 把项目克隆到本地:git clone https://github.com/nanobrowser/nanobrowser.git,然后进文件夹:cd nanobrowser;
- 装依赖:pnpm install;
- 编译:pnpm build,编译好的文件在 “dist” 文件夹里;
- 再按 “手动安装” 的步骤,加载 “dist” 文件夹就行。
总的来说,Nanobrowser 就是一个 “轻量、免费、可控” 的 AI 网页助手 —— 不用学复杂的自动化脚本,不用花大价钱买会员,只要会说话,就能让浏览器自己干活,适合经常需要跟网页打交道的学生、上班族、研究者。
仅供个人学习参考/导航指引使用,具体请以第三方网站说明为准,本站不提供任何专业建议。如果地址失效或描述有误,请联系站长反馈~感谢您的理解与支持!
链接: https://fly63.com/nav/4538