Tessract OCRの使用
今日は、進行中のプロジェクトにOCR機能を追加したいので、探していたOCR Tesseract OCRをCORAPで直接練習して、その簡単な使い方を知りたいと思います!
Tesseract OCR?
Tesseract OCR?
クローズアップはApache 20ライセンスのオープンソーステキスト識別エンジンに使用できます.UTF-8をサポートし、100以上の言語をサポートします.使用時の欠点はGPU:-1すなわちGPUを使用しないため速度が遅いことである.
Python Tesseract?
Python TessractはGoogleのTessract-OCRエンジンのパッケージライブラリです!
必要なプログラムをダウンロード
Tessractのダウンロード
!sudo apt install tesseract-ocr
pytesseractのダウンロード
!pip install pytesseract
import
import pytesseract
import cv2
import os
from PIL import Image
from google.colab.patches import cv2_imshow
コードアクチュエータ
#이미지를 불러와 gray 스케일로 변환해 준다.
image = cv2.imread('numbers.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
#pytesseract에서는 numpy array를 읽지 못하고 file을 읽기 때문에 os로 파일을 불러들여야 한다.
filename = "{}.png".format(os.getpid())
cv2.imwrite(filename, gray)
#pytesseract의 image to string을 써준다.
#숫자니까 lang = 'None'으로
text = pytesseract.image_to_string(Image.open(filename), lang = None)
os.remove(filename)
#결과를 보자.
print(text)
cv2_imshow(image)
結果
かなり満足のいく結果が出力されました!:)
Reference
この問題について(Tessract OCRの使用), 我々は、より多くの情報をここで見つけました
https://velog.io/@be1le/Tesseract-OCR-사용하기
テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol
Python TessractはGoogleのTessract-OCRエンジンのパッケージライブラリです!
必要なプログラムをダウンロード
Tessractのダウンロード
!sudo apt install tesseract-ocr
pytesseractのダウンロード
!pip install pytesseract
import
import pytesseract
import cv2
import os
from PIL import Image
from google.colab.patches import cv2_imshow
コードアクチュエータ
#이미지를 불러와 gray 스케일로 변환해 준다.
image = cv2.imread('numbers.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
#pytesseract에서는 numpy array를 읽지 못하고 file을 읽기 때문에 os로 파일을 불러들여야 한다.
filename = "{}.png".format(os.getpid())
cv2.imwrite(filename, gray)
#pytesseract의 image to string을 써준다.
#숫자니까 lang = 'None'으로
text = pytesseract.image_to_string(Image.open(filename), lang = None)
os.remove(filename)
#결과를 보자.
print(text)
cv2_imshow(image)
結果
かなり満足のいく結果が出力されました!:)
Reference
この問題について(Tessract OCRの使用), 我々は、より多くの情報をここで見つけました
https://velog.io/@be1le/Tesseract-OCR-사용하기
テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol
#이미지를 불러와 gray 스케일로 변환해 준다.
image = cv2.imread('numbers.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
#pytesseract에서는 numpy array를 읽지 못하고 file을 읽기 때문에 os로 파일을 불러들여야 한다.
filename = "{}.png".format(os.getpid())
cv2.imwrite(filename, gray)
#pytesseract의 image to string을 써준다.
#숫자니까 lang = 'None'으로
text = pytesseract.image_to_string(Image.open(filename), lang = None)
os.remove(filename)
#결과를 보자.
print(text)
cv2_imshow(image)
Reference
この問題について(Tessract OCRの使用), 我々は、より多くの情報をここで見つけました https://velog.io/@be1le/Tesseract-OCR-사용하기テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol