我搞了一本冷门但是高质量的学术书籍(英文),已经OCR转成md格式了,请教佬友有没有什么现成的工具能用LLM搞翻译(打算用qwen3)。目前只看到了AiNiee,有空打算试试
我倒是建议转换成PDF,然后用这个在线PDF翻译,这是我见过的翻译学术最好的论文,其中可以保持原来排版,简直强爆了
量大的话确实推荐AiNiee,这东西多线程做的不错
不过需要改下prompt,默认是针对游戏的
这个我试了一下,效果不太好
ainiee的自定义api好容易出bug,得等作者修了
与 ainiee 类似定位的还有一个 LinguaGacha ,但这个项目功能好像少一些。
gpt_academic 有翻译功能,但部署麻烦、而且不是专门的翻译软件。
沉浸式翻译能翻译 markdown 文件,但说实话,我感觉这个功能做得很不用心,不推荐。
站内的 paper-burner 网页端点击即用,我用ocr比较多,对它的翻译功能用得少,就不做评价了。
doc2x,付费服务,但是不能自定义API,不符合你的需求。
还有一种方案,直接让AI帮你写个小脚本,分割、翻译,差不多就够了,也不复杂。
md直接拖到沉浸式翻译里就可以
让AI写一个小脚本自动分割翻译就行,提示词里写上翻译要求,要求也可以让AI写。
我现在还是最笨的方法复制进google ai studio读一点翻译一点,因为gemini可以直接读图,不需要ocr;
偶尔我也会用calibre的翻译插件跑,不过对pdf、epub的支持更好一点,主要是可以自动分割:
可以自定义提示词、api
这个页数多不行
markdown和txt差不多,只需过滤掉,行间公式,图像链接,表格表达式即可。
我常用方案,用epub编辑器sigil和calibre。
1,
markdown改成txt,
2,
sigil打开txt,而后导出epub,目的是会自动根据空行分隔每一段,
3,
calibre有插件ebooks translator,拿来翻译epub,该插件可以过滤掉你不想翻译的文本。
4,导出交叉原译文为txt,修改成markdown就完事。
Math translate 尝试过吗?
有个来源的项目叫GPT学术吧,可以整文翻译的,已经有MD的话,扔进gemini全文翻译就是了
