工具名:gptpdf

功能:使用视觉大语言模型(如 GPT-4o)将 PDF 解析为 markdown。

通过只有293行代码几乎可以完美地解析PDF排版、数学公式、表格、图片、图表等。每页平均价格约为0.013 美元

处理流程:
1. 使用 PyMuPDF 库,对 PDF 进行解析出所有非文本区域,并做好标记;
2. 使用视觉大模型(如 GPT-4o)进行解析,得到 markdown 文件。

GitHub地址

关注频道 @ZaiHuaPd
频道爆料 @ZaiHuabot
 
 
Back to Top