Tessract OCRの使用

1525 ワード

OCR python tesseract テキストリンク

今日は、進行中のプロジェクトにOCR機能を追加したいので、探していたOCR Tesseract OCRをCORAPで直接練習して、その簡単な使い方を知りたいと思います!

Tesseract OCR?

クローズアップはApache 20ライセンスのオープンソーステキスト識別エンジンに使用できます.UTF-8をサポートし、100以上の言語をサポートします.使用時の欠点はGPU:-1すなわちGPUを使用しないため速度が遅いことである.

Python Tesseract?

Python TessractはGoogleのTessract-OCRエンジンのパッケージライブラリです!

必要なプログラムをダウンロード

Tessractのダウンロード

!sudo apt install tesseract-ocr

pytesseractのダウンロード

!pip install pytesseract

import

import pytesseract
import cv2
import os
from PIL import Image
from google.colab.patches import cv2_imshow

コードアクチュエータ

#이미지를 불러와 gray 스케일로 변환해 준다.

image = cv2.imread('numbers.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

#pytesseract에서는 numpy array를 읽지 못하고 file을 읽기 때문에 os로 파일을 불러들여야 한다.
filename = "{}.png".format(os.getpid())
cv2.imwrite(filename, gray)

#pytesseract의 image to string을 써준다. 
#숫자니까 lang = 'None'으로

text = pytesseract.image_to_string(Image.open(filename), lang = None)
os.remove(filename)

#결과를 보자.

print(text)
cv2_imshow(image)

結果

かなり満足のいく結果が出力されました!:)

Reference

この問題について(Tessract OCRの使用), 我々は、より多くの情報をここで見つけました https://velog.io/@be1le/Tesseract-OCR-사용하기

テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。

Collection and Share based on the CC Protocol

Programmers-最大公約数と最小公倍数(Python)

dp px変換ツール