参考
- 277.精读《利用 GPT 解读 PDF》 (opens in a new tab)
- Youtube 视频介绍:ChatGPT for YOUR OWN PDF files with LangChain (opens in a new tab)
- 详细的介绍了 PDF 解析原理和代码执行流程
- 评论区有相关链接
- https://pdfgpt.io (opens in a new tab) : 在线 PDF 解析能力
- 支持 1000 页以内的 pdf 解析
- 需要添加 api key
- colab (opens in a new tab):使用 colab 一步步来实现这个能力
- 注意:如果是中文 pdf 的话,由于中文额外占用较多 token,所以文本拆分的时候,需要把 chunk_size 修改小一点,不然会触发错误(提示 token 太长无法生效)