[开源/即开即用/持续迭代]Agent伴读🤖!专为学术/工作打造,您的一站式AI翻译/阅读/分析工作站

Paper burner X (好耶是新帖

浏览器打开即用Github地址
感谢各位佬的支持!项目已经达到300 stars啦。
现在继续在做后端的部分,功能方面也收到了佬们的很多建议。
会陆续来做优化以及实现,尽量提高质量,加快速度。

感谢支持,共同进步

最新更新

25/10/10 引文矩阵来啦

[!tldr]+ 点击了解引文矩阵

之前有一段时间,没把最新的进度更新到主贴了

所以给佬们简单介绍一下,从这之后更新的一些新功能

1. 保留格式的PDF翻译

[!tldr]- 入口:MinerU —— 结构化翻译模式

2. 比如AI对话,对于长文本的处理:

[!tldr]- 点击了解多功能检索 Agent

  • 给 ai 提供了 grep、vector search、map、fetch 等一系列工具
  • 告诉 AI 应该在什么情况下使用何种工具(提示词优化),AI 会根据需求,来判断需要加入多少内容到上下文,以及如果“感兴趣”,会获取完整内容。
  • 加入了意群/地图,希望保持 AI 的“全局视角”。
  • 允许在模型和 key 设置里,配置 embedding 模型,并使用向量搜索。
  • 模型消耗丰俭由人(比如佬如果只想要搜一下关键词,没必要使用向量搜索,那么就可以不使用 embedding 和地图/意群机制,从而减少消耗)
  • 效果尚可,我常用测试过的有 grok-4-fast、gemini-2.5-flash-preview-09-2025 等,佬们可以在阅读中使用自己常用的模型,如果效果好的话,可以在帖子里反馈一下(
  • 大概这样

在此基础上,之后就后续加入mcp之类的了
(不过我也做了一个mcp的gateway,打算不久后开源,之后会适配

3. 多种OCR来啦

目前支持mistral / doc2x / mineru(其中后两者需要一次部署配置cf worker即可)
设计了一个简单的 pb-ocr-proxy,教程见 :backhand_index_pointing_down:

4. 比如对翻译方面进行了一些增强

  • 格式方面,
    导入从最开始的只支持pdf/md/txt,扩充到了 PDF / MD / TXT / DOCX / PPTX / HTML / EPUB / YAML
    导出也是可以支持多种格式(包括docx、pdf),并可以导出原文/译文/对比模式的情况

  • 效果方面:
    增加了备择库(术语库),支持快速导入导出,会自动匹配块中的原文,注入固定的译文。这样,对翻译的一致性有很大的提升。

[!tldr]- 术语备择库

增加了提示词池:能够实现由某个元提示词,生成一系列具有相似需求的提示词,并有健康管理,增强了部分模型的可用性。

[!tldr]- 提示词池

  • 批量模式支持(支持整库翻译/文件夹翻译,导出为多种格式),
    看到了该如何处理批量文件翻译呢??? 佬发的贴,
    进而支持了一整个github库的翻译/或是文件夹的翻译
    比如:

[!tldr]- 小试牛刀
对很火的老乡鸡项目,做了一个很快的i18n(
修改后大概长这样:backhand_index_pointing_right:演示站:CookLikeHOC
并适当增加了默认的并发数。

5. 其他方面也零零散散的做了一些优化

  • 比如佬有提到公式渲染,做了一些优化
  • 优化了流程图的生成
  • 优化了标注和高亮系统
  • UI和性能做了一些优化,重构了一些内容
  • 还支持了始皇的deeplx(

6. 而且加了新logo, be like :backhand_index_pointing_down: (主要hhh)


五个点形成一个X的巧思什么的(

以及,佬还带来了思考,未来会迭代并持续实现流程优化。

7. 未来的功能展望

  • 加入更多OCR(有些要本地启动一个后端) :ok_hand:做完了!
  • 保留PDF格式翻译 :ok_hand:做完了!
  • 加入MCP,实现搜索等功能
  • 参考文献,基于工具实现统一获取原文并直接翻译
  • 先读后看!打通标注和高亮系统与AI助手,AI将会知道你“感兴趣”的段落
  • AI根据内容,生成PPT
  • 浏览器插件
  • 云存储

欢迎佬们提出更多的需求,将会尝试实现。
未来也将会把进度更新到帖子里,希望和社区一起成长

即开即用Github地址

纲领,以及努力的方向
[开源/即开即用/持续迭代]Agent伴读🤖!专为学术/工作打造,您的一站式AI翻译/阅读/分析工作站 - #135,来自 wingand

声明:

本项目基于baoyudu/paper-burner,并已在原始项目上进行了重构和极多内容的扩充。
但因避免和Paper Burner原项目名称产生重复,为示尊重和区分,故该分支项目改名Paper Burner X。
感谢佬友提醒,项目中我写的部分采用了新的AGPL 3.0(原始部分在历史记录中,依然采用GPL 2.0),出于防止"云服务漏洞",并进一步保护开源社区的利益。

240 个赞

哇 谢谢 大佬

6 个赞

大佬牛!

5 个赞

感谢大佬的项目

4 个赞

感谢佬友分享

3 个赞

谢谢大佬

4 个赞

(对了,还支持了始皇的deeplx
hhh

3 个赞

有大用,谢谢佬u​:folded_hands:

3 个赞

好耶(:

4 个赞

昨晚翻到佬的帖子,还以为不更新了。没想到今天又看到了,支持佬友 :grinning_face_with_smiling_eyes:

3 个赞

因为之前停更了一个月,就没法编辑主帖了(
所以新的功能一直都没有更新上来
hhh借加logo换了个新主帖

3 个赞

wow,强呀,支持!

3 个赞

太厉害佬支持支持

4 个赞

可以不ocr直接用吗:eyes:

3 个赞

可以的,只要不是pdf,就可以跳过ocr直接翻译
比如md epub啥的

不翻译也可以,可以直接导进来阅读
(导入时候设置无需翻译,如果需要ai辅助阅读,使用时再启用翻译/助手 ai即可)


这个功能已经实现了,也就是直接导入pdf且不用ocr

4 个赞

很棒,试过了,提了issue

3 个赞

感谢反馈,之后会完善这些

2 个赞

因为论文一般都是pdf,感觉上传之后必须设置 Mistral API 会有点难受,论文pdf一般是可以解析出足够进行问答的文本的?:thinking:

我试了选择不翻译,还是需要设置 ocr 的key,无法进入下一步

5 个赞

目前解析pdf确实需要mistral key

好,这个需求我这几天加上

应该是可以的,不过这样对图片/表格的解析可能不太好,总之我试一下

4 个赞

佬友太强了 :+1:
感谢佬友分享 :folded_hands:

3 个赞