请问下大家有什么平台转PDF为markdown最好用？

wang_yi · 2025 年11 月 16 日 15:30

用过minerU和paddleOCR，多多少少会有些错误，尤其是有的PDF是可以复制文字那种，大模型还是强制OCR，请问各位有没有能高效提取PDF文字的工具？

han_luoke · 2025 年11 月 16 日 15:53

olmOCR2-7b 这个还不错

chnyhz · 2025 年11 月 16 日 16:13

你是用来给大语言模型搞知识库用吗，我觉得minerU-2.5模型不错吧，可能你没选最新模型

wang_yi · 2025 年11 月 17 日 01:45

好的，感谢， miner-U我都是直接用的官网的，没专门找2.5这个，我去找找

WhoToFind · 2025 年11 月 17 日 01:48

docling

xmk · 2025 年11 月 17 日 01:48

datalab可以

dongfang7083 · 2025 年11 月 17 日 02:12

这个效果对比贴，佬友可以参考一下

WaiHo_Lei · 2025 年11 月 17 日 02:15

目前我用mineU来转markdown，还挺好用的，但是有些表格的转换会有点问题需要手动微调

yuke · 2025 年11 月 23 日 12:33

可以试试docling

paul_guo · 2025 年11 月 23 日 12:41

我用mineru。。。做电子书来听

weakchen · 2025 年11 月 23 日 12:49

话题		回复	浏览量
请问有什么PDF转成markdown 式的目前最好的方案开发调优人工智能 , 快问快答 , 软件开发	11	259	2026 年4 月 15 日
佬友们，求一个好用的pdf word转markdown的工具搞七捻三求资源	6	147	2026 年3 月 23 日
最好用的文件转markdown的工具是哪个？我用的这个不太好用开发调优快问快答	1	142	2025 年11 月 10 日
有什么好的方式将pdf转为md 开发调优人工智能 , 快问快答	30	621	2025 年9 月 25 日
pdf 转 md 的最佳实践是什么开发调优快问快答	24	340	2026 年4 月 7 日