pypdfium2 PDFium 的python 包裝
pypdfium2 是對于PDFium的python 包裝,官方說明處理任務性能可以接近PyMuPDF
說明
pypdfium2 內部基于了ctypesgen 包裝(相比原始進行了自己的擴展),生成python 綁定的代碼,這樣可以進行快速的代碼處理,我在測試提取一個14m的pdf 文本內容花了不到3s,同時將每頁轉換為圖片花了80多s(818頁),整體性能還是很不錯的,值得嘗試下
參考資料
https://github.com/pypdfium2-team/pypdfium2
https://github.com/pypdfium2-team/ctypesgen
https://github.com/pymupdf/PyMuPDF
浙公網安備 33010602011771號