paddleocr圖片文字識別

介紹：PaddleOCR是由百度開發(fā)的一個OCR庫，基于深度學(xué)習(xí)框架PaddlePaddle。PaddleOCR支持多語言文本識別，特別適合中文場景，同時它還提供了豐富的預(yù)訓(xùn)練模型。

1、安裝

pip3 install paddlepaddle
pip3 install paddleocr

2、使用

from paddleocr import PaddleOCR

def paddle_image():
    ocr = PaddleOCR(use_angle_cls=True, lang='ch')
    # 讀取圖像
    results = ocr.ocr(image_path, cls=True)
    # for (bbox, text) in results[0]: print(f"{text}")
    # 打印識別結(jié)果
    for line in results:
        for word_info in line:
            print(f"Detected text: {word_info[1][0]}, Confidence: {word_info[1][1]:.2f}")

paddle_image()

3、注意事項

3.1、windows使用時報錯pyclipper模塊init文件中ImpoerError:DLL load failed:找不到指定的模塊。

　　動態(tài)鏈接庫 (DLL)，下載并安裝 Microsoft Visual C++ Redistributable。https://learn.microsoft.com/en-us/cpp/windows/latest-supported-vc-redist?view=msvc-170

? 選擇與你的 Python 版本匹配的版本（x86 或 x64）。

3.2、未聯(lián)網(wǎng)環(huán)境復(fù)制下C:\Users\zhouman02\.paddleocr\whl

聯(lián)網(wǎng)自動安裝：

download https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_det_infer.tar to C:\Users\zhouman02/.paddleocr/whl\det\ch\ch_PP-OCRv4_det_infer\ch_PP-OCRv4_det_infer.tar
100%|██████████| 4.89M/4.89M [00:06<00:00, 758kiB/s]
download https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_rec_infer.tar to C:\Users\zhouman02/.paddleocr/whl\rec\ch\ch_PP-OCRv4_rec_infer\ch_PP-OCRv4_rec_infer.tar
100%|██████████| 11.0M/11.0M [00:05<00:00, 2.19MiB/s]
download https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar to C:\Users\zhouman02/.paddleocr/whl\cls\ch_ppocr_mobile_v2.0_cls_infer\ch_ppocr_mobile_v2.0_cls_infer.tar
100%|██████████| 2.19M/2.19M [00:03<00:00, 658kiB/s]

3.3、報錯ModuleNotFoundError: No module named ‘paddle’

　　paddlepaddle未安裝時會報該錯誤，安裝后import paddle則不會報錯

posted @ 2025-01-21 19:59 zmm521 閱讀(228) 評論(0) 收藏舉報

刷新頁面返回頂部

zmm521