如何调用大模型api分析pdf

conheaven · 2025 年3 月 10 日 13:09

佬们，我想在本地调用大模型api分析pdf文件，有哪些可用的手段呢？

stevessr · 2025 年3 月 10 日 13:10

优先原生多模态吧
次一点就是手动RAG和OCR之类的手段了

conheaven · 2025 年3 月 10 日 13:11

多模态模型的api可以上传文件吗？

yyy2024 · 2025 年3 月 10 日 13:12

1、多模态大模型；
2、可读的pdf转成md，喂给大模型；
3、pdf拆成一个一个的图片，ocr整合，喂给大模型。

Juya · 2025 年3 月 10 日 13:12

是文字的还是扫描版的，Gemini原生支持PDF文档，要不就只能转图片调用视觉模型，或者用各种转换工具转为Markdown。

stevessr · 2025 年3 月 10 日 13:12

当然

QWEN VL之类也可以

conheaven · 2025 年3 月 10 日 13:16

感谢感谢，我去看看

conheaven · 2025 年3 月 10 日 13:16

好的，感谢感谢

conheaven · 2025 年3 月 10 日 13:16

文字版的，想分析arxiv的论文

Throttle · 2025 年3 月 10 日 13:50

Moonshot AI 有文件上传接口可以看看

conheaven · 2025 年3 月 10 日 13:54

qwenvl好像不可以，qwen-long模型可以

weakchen · 2025 年3 月 10 日 14:07

如果想让大模型分享PDF，特别是针对有图形、文字、图表等的PDF，最好的方法是使用Dify中的知识库，用Embedding模型对PDF文件进行分段保存，这样更利于后期大模型进行解读。

Sam_Altman · 2025 年3 月 10 日 14:10

啊我都是直接用openruter的gemini 2.0pro直接传pdf给gemini的

zmone · 2025 年3 月 10 日 14:47

大佬，这个怎么操作？调用API吗

Sam_Altman · 2025 年3 月 10 日 15:13

对就是普通的调用api 爬爬虾有介绍 b站搜技术爬爬虾

ic-zjh · 2025 年3 月 10 日 16:08

conheaven · 2025 年3 月 10 日 16:10

我看这个只有翻译之类的，没有分析的功能吧？

ic-zjh · 2025 年3 月 10 日 16:12

解析成md然后再导入一些dif，fastgpt，ragflow的平台就ok了
，fastgpt和这个网站配合比较好，可以直接调用这个网站的 api把 pdf处理成 md格式或者适合大模型学习的文档格式，再进行后续的处理

mos6 · 2025 年3 月 10 日 16:27

再次安利这个佬的

conheaven · 2025 年3 月 10 日 16:37

好，感谢感谢

话题		回复	浏览量
想问问各位佬是用什么翻译pdf文献的哇？我平时都用的小绿鲸，平时也会充token用它的AI解析，有没有更好用的，就是类似接入apiURL然后翻译的。如果没有就算啦，只是问问嘞搞七捻三快问快答	16	490	2025 年3 月 13 日
如何把一整个PDF的论文发给AI？资源荟萃人工智能 , 快问快答	25	935	2025 年4 月 7 日
其他渠道Deepseek模型转Deepseek格式，各位大佬有办法吗搞七捻三 DeepSeek , 纯水	5	216	2025 年3 月 13 日
AMC支持调用Gemini API原生功能生成PDF文件，PDF生成到打印三分钟搞定开发调优人工智能	18	496	2025 年12 月 7 日
o3和o4-mini处理不了扫描版的pdf，但是gemini可以开发调优人工智能 , 快问快答 , 纯水	15	460	2025 年6 月 24 日