请问现在有哪些模型支持直接翻译整本书的
一本书算四万字左右的话
因为如果不裁切翻译可以比较保持连贯性
2 个赞
我也想知道 ![]()
1 个赞
试试kimi?
1 个赞
kimi质量不行啊 我至少要claude 3.5sonnet 的水平 钱不是问题
1 个赞
将文本直接发给aistudio的gemini,我通常是用gemini thinking
1 个赞
emmm,这有点困难,不然就只能人工/python一页一页翻译了
我试试看 不對阿 他output 有極限阿 8192token而已 input沒問題
一页一页 现在很多别人写好的程序没问题 但是像是翻译的问题 如果你裁切之后 像是日文转中文时很多 同一个人它前面是男的后面是女的变得十分割裂
就算你输入最大长度够了,输出最多也就8k
2 个赞
或许可以这样,对前一页进行一个总结,然后在下一页翻译时录入这个总结
gemini 1m上下文差不多吧
pdf2zh
可以本地化部署,给大语言模型的API和密钥即可
1 个赞
全书是背景放进去,然后一次翻译一段,这样就可以
1 个赞
感觉你可以先用代码跑一下Claude的分词器,看看到底占用多少
借助这个项目试试看,有上下文选项的,但花钱有点多()
1 个赞
# background
{{全文}}
# text
{{具体某一章节}}
很难,现有的项目都做不到你要求的完全上下文
可能的就是翻译+总结然后提交给下一段参考
2 个赞
看起来需要保持人物角色的一致,这个挺困难的
单纯的翻译感觉无法满足要求,需要人工介入,先提取出出现的人物,然后每一两千字让LLM翻译,并说明出场的人物是哪几个人
少量文本的话,就人工总结出场人物吧
gemini
1 个赞
如果是pdf文档,我推荐你用下面这个网站: