现在怎么处理pdf文件呢

Bink · 2026 年1 月 8 日 08:32

想要解析pdf文件，将文字，表格图片提取出来图片交给大模型解析，然后将文字描述替换拼接到提取的文字中，佬友现在有什么快捷，准确的办法来实现

Ling_Jing · 2026 年1 月 8 日 08:34

PDF用MinerU转Markdown

Benjamin1314 · 2026 年1 月 8 日 08:35

把pdf转换成word文档

H-Pulse · 2026 年1 月 8 日 08:35

GPT会自己解析的

Benjamin1314 · 2026 年1 月 8 日 08:35

如果是交给大模型解析，gemini支持pdf的

zzzrayzzz · 2026 年1 月 8 日 08:36

好东西试试看
昨天还在mac本地搓一个带OCR的mcp直接帮codex去看文档

Bink · 2026 年1 月 8 日 08:37

我试试我都是手动提取然后将图片提交给大模型，最后拼接的时候现在的包处理图片位置提取的不准

Bink · 2026 年1 月 8 日 08:38

是有个需求需要先解析文件然后再喂大模型api

Ling_Jing · 2026 年1 月 8 日 08:39

MinerU也有api免费额度，可以试一下

Bink · 2026 年1 月 8 日 08:40

嗯嗯我去试试看

1715191173 · 2026 年1 月 8 日 08:41

Adobe Acrobat里面自带OCR，然后把OCR给AI通过上下文修复

wcvb13 · 2026 年1 月 8 日 08:44

Claude code不是有个skill是操作pdf的，可以用这个skill试下

leftover · 2026 年1 月 8 日 08:46

可以用mineru提取出来，然后把图片的位置替换为对应的图片描述，gemini可以直接解析，我猜测他们应该也是对pdf做了解析，将其转为了文本；或者把pdf为每一页提取为一张图片给LLM进行处理

Bink · 2026 年1 月 8 日 08:49

pymupdf 我是使用这个库，然后把图片给大模型解析，最后再替换但时候这个库处理表格解析的时候有点问题，直接按照文字提取的话就看不出这个是表格数据了

leftover · 2026 年1 月 8 日 09:10

mineru会把表格解析成html的格式，效果还可以，但是对于一些复杂的表格，也不能保证百分百正确，你可以先大概测试一下，看一下表格的解析是否有问题，如果会出现解析错误的情况的话，可能得通过多种方式对表格分别进行解析，比如分别使用mineru、paddle，gemini等对这个表格进行解析，然后在保证结果都相同的情况下确认这个表格是被正确解析的。

你直接去对mineru解析出来的中间结果进行处理，最后把处理的结果全部拼接起来，不要直接在他输出的md文档上处理。

话题		回复	浏览量
请教各位佬友，如何准确提取学术论文pdf的信息搞七捻三人工智能	20	264	2026 年3 月 14 日
如何提取复杂PDF中的表格? 开发调优人工智能	16	274	2025 年12 月 22 日
通过把PDF、Word、Excel等文件转Md 开发调优人工智能	15	482	2025 年7 月 18 日
PDF生成markdown格式的工具资源荟萃人工智能	14	418	2025 年9 月 3 日
如何把一整个PDF的论文发给AI？资源荟萃人工智能 , 快问快答	25	937	2025 年4 月 7 日

现在怎么处理pdf文件呢

相关话题