秉持着不造轮子原则,我调研了市面上的 AI 浏览器扩展,大致如下:
- 聚焦对话场景:代表是 Monica;
- 聚焦自动化场景:代表是开源的 Nanobrowser;
- 实现 skills 规范:目前只看到我开源的 Tactus;
我也分别体验了我自己的一个场景:总结本站帖子。
Monica
原理应该是获取当前网页的链接,然后再请求一次解析网页响应。
无法配置特定网站的总结提示词和获取完整流式加载内容。
Nanobrowser
具备自动化能力,不过居然不直接提取网页内容,我一开始以为他要一直下滑到加载完整评论区,但选择了下滑到主帖的底部就开始总结了。而且体感挺慢,每一步下滑都要决策。
一样无法配置特定网站的总结提示词。因为有自动化能力,流式加载内容可以靠提示。
我开源的 Tactus
解决了无法配置特定网站的总结提示词和获取完整流式加载内容的痛点。
魔法就是skills,我把获取主帖及完整评论区封装在了 skills 的脚本中,Agent 自行判断当前网页是 L站,用户的提问需要获取主帖及完整评论区,于是加载 skills。
SKILLS.md 中有总结帖子的提示词就能实现动态注入,特定工作流封装脚本就能执行。
总结对比
| 对比维度 | Monica | Nanobrowser | Tactus |
|---|---|---|---|
| 获取网页 | |||
| 自动化 | todo(计划站在巨人的肩膀上) | ||
| 特定场景提示词注入 | |||
| 工作流执行 |
都看到这啦!想不想体验呢,马上来!
扩展安装包直接搬来了,关注下 github 仓库会有最新版,目前最新就是 1.0.2
tactus-1.0.2-chrome.zip (160.6 KB)
获取L站帖子的主帖及评论区的skills,在扩展的设置页中上传文件夹导入~
fetch-linuxdo-post.zip (7.3 KB)
详细背景和使用说明请看上一个帖子:【开源】首个支持 Agent Skills 的浏览器扩展 Tactus | 取之社区、回馈社区,首个开源项目献给L站!
开源仓库如下,好用的话点个小星星,也是支持我前进迭代的最大动力!





