Tessract OCRの使用


今日は、進行中のプロジェクトにOCR機能を追加したいので、探していたOCR Tesseract OCRをCORAPで直接練習して、その簡単な使い方を知りたいと思います!

Tesseract OCR?


クローズアップはApache 20ライセンスのオープンソーステキスト識別エンジンに使用できます.UTF-8をサポートし、100以上の言語をサポートします.使用時の欠点はGPU:-1すなわちGPUを使用しないため速度が遅いことである.

Python Tesseract?


Python TessractはGoogleのTessract-OCRエンジンのパッケージライブラリです!

必要なプログラムをダウンロード


Tessractのダウンロード

!sudo apt install tesseract-ocr

pytesseractのダウンロード

!pip install pytesseract

import


import pytesseract
import cv2
import os
from PIL import Image
from google.colab.patches import cv2_imshow

コードアクチュエータ

#이미지를 불러와 gray 스케일로 변환해 준다.

image = cv2.imread('numbers.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

#pytesseract에서는 numpy array를 읽지 못하고 file을 읽기 때문에 os로 파일을 불러들여야 한다.
filename = "{}.png".format(os.getpid())
cv2.imwrite(filename, gray)

#pytesseract의 image to string을 써준다. 
#숫자니까 lang = 'None'으로

text = pytesseract.image_to_string(Image.open(filename), lang = None)
os.remove(filename)

#결과를 보자.

print(text)
cv2_imshow(image)

結果



かなり満足のいく結果が出力されました!:)