發表文章

Python OCR 使用手冊 : 圖片轉文字 超簡單上手

圖片
  Python OCR 使用手冊 : 圖片轉文字 , 超簡單上手 OCR x Pytesseract 前言 在 Python 中, 使用  OCR  (Optical Character Recognition , 字元辨識) 將圖片的內容轉換成一般的文本,非常簡單。 只要將相關軟體 與 Python 套件安裝完成後,即可運行程式, 這份文件就是將之前的踩坑過程記錄下來,以供想後續想要研究的開發者可以快速上手。 安裝文件與範例程式 【安裝文件】 https://gitlab.com/GammaRayStudio/DevDoc/-/blob/master/Python/004.PythonOCR.md 【範例程式】 https://gitlab.com/GammaRayStudio/Program/PythonStudio/SE/PythonOCR 圖片範例 轉換目標 英文 圖片 文字 English Gamma Ray Studio English Text Text Text Text ~ !!! 繁體中文 圖片 文字 繁體中文 Gamma Ray 軟體工作室 中文 文字 文字 文字 文字 ~ !!! 簡體中文 圖片 文字 简体中文 Gamma Ray 软体工作室 中文 文字 文字 文字 文字 ~ !!! 安裝 Tesseract Win https://github.com/UB-Mannheim/tesseract/wiki 環境變數 Mac brew install tesseract Linux apt-get install tesseract-ocr 驗證 tesseract -v Python 環境 Python 版本 python -V Python 3.8.5 PyPI Pillow pytesseract pip3 install Pillow pip3 install pytesseract Python 範例 from PIL import Image import pytesseract img_name = './001.en-us.png' img = Image . open ( img_name ) text = pytesseract . image_to_string ( img , lan