pytesserに関するいくつかの問題
ここ数日python検証コードの識別をしていますが、主にpythonのocrライブラリを運用していますが、残念ながらインストール時に多くの問題が発生し、google、stackoverflow、baiduでは効果的に解決されていません.
一、運行の主な問題は以下の通りである:
WindowsError:[Error 2]は、一般的に信頼できるファイルが見つからないという意味です.
ソリューション:1、実行するファイルをpytesserのパッケージの下に直接置きます.2、site-packagesの下にパッケージすると、上記のような問題がずっと存在する可能性がありますが、何度もやったのか、それともそうなのか、問題はtesseractであるべきです.exe実行プログラムは環境変数ではなく、自分で変更して環境変数に直接追加することができます.怠け者は方法1のように操作すればいいです.
pytesserでpyファイルには次のものがあります.
This file must be .bmp or other Tesseract-compatible format
したがって、自分が入力ファイルをうまくサポートできない場合は、-
二、もう一つの間違いはerrorsです.pyファイルが見つかりませんtesseract.logファイル
これはpytesserでpyファイルでsubprocessを呼び出すとtesseractが実行されます.exeエンジンはエラー(すなわちtesseract.logファイルを生成していない)を返さず、必要なファイル結果も出力していない(すなわちtesseract.logのパラメータが必要な関数に入った)--回りくどいように聞こえて、とにかくバグが発生した.部分コード:
興味のある学生はプログラムのソースコードを見に行くことができて、長くありません.どうすればいいのでしょうか?は簡単です.かばんの中にtesseractを見つけます.exe、ダブルクリックすればいい、tesseractが自動的に生成されます.logエラーログ. tesseractを使用したい場合.exe直接認識、フォーマット
最後に、添付ファイル:
1、PyTesser 2、Tesseract 3、または私の以前のcsdn上のPyTesserリソース注:ネット上にtessdataを交換する内容があるので、交換する必要はありません
Dependencies: pytesser.py Main module for importing util.py Utility functions used by pytesser.py errors.py Interprets exceptions thrown by Tesseract tesseract.exe Executable called by pytesser.py tessdata/Resources used by tesseract.exe
一、運行の主な問題は以下の通りである:
Traceback (most recent call last):
File "C:\Users\TF-2016\Desktop\spider\ruijie\ruijie.py", line 33, in
print image_file_to_string('11.png', graceful_errors=True)
File "C:\Python27\lib\site-packages\pytesser\pytesser.py", line 48, in image_file_to_string
call_tesseract(filename, scratch_text_name_root)
File "C:\Python27\lib\site-packages\pytesser\pytesser.py", line 23, in call_tesseract
proc = subprocess.Popen(args)
File "C:\Python27\lib\subprocess.py", line 710, in __init__
errread, errwrite)
File "C:\Python27\lib\subprocess.py", line 958, in _execute_child
startupinfo)
WindowsError: [Error 2]
WindowsError:[Error 2]は、一般的に信頼できるファイルが見つからないという意味です.
ソリューション:1、実行するファイルをpytesserのパッケージの下に直接置きます.2、site-packagesの下にパッケージすると、上記のような問題がずっと存在する可能性がありますが、何度もやったのか、それともそうなのか、問題はtesseractであるべきです.exe実行プログラムは環境変数ではなく、自分で変更して環境変数に直接追加することができます.怠け者は方法1のように操作すればいいです.
pytesserでpyファイルには次のものがあります.
This file must be .bmp or other Tesseract-compatible format
したがって、自分が入力ファイルをうまくサポートできない場合は、-
image\_to_string()
関数を直接使用すると失敗しやすい、-できるだけimage\_file\_to\_string(filename, cleanup=cleanup\_scratch\_flag, graceful\_errors=True)
を使用して、最後のgraceful_に注意してください.errors=Trueは、もちろんデフォルト値が設定されており、手動で値を割り当てる必要はありません.二、もう一つの間違いはerrorsです.pyファイルが見つかりませんtesseract.logファイル
これはpytesserでpyファイルでsubprocessを呼び出すとtesseractが実行されます.exeエンジンはエラー(すなわちtesseract.logファイルを生成していない)を返さず、必要なファイル結果も出力していない(すなわちtesseract.logのパラメータが必要な関数に入った)--回りくどいように聞こえて、とにかくバグが発生した.部分コード:
def check_for_errors(logfile="tesseract.log"):
inf = file(logfile)
text = inf.read()
inf.close()
# All error conditions result in "Error" somewhere in logfile
if text.find("Error") != -1:
raise Tesser_General_Exception, text
興味のある学生はプログラムのソースコードを見に行くことができて、長くありません.どうすればいいのでしょうか?
tesseract.exe input_filename output_filename
(eg:tesseract.exe default.png default)
最後に、添付ファイル:
1、PyTesser 2、Tesseract 3、または私の以前のcsdn上のPyTesserリソース注:ネット上にtessdataを交換する内容があるので、交換する必要はありません
Dependencies: pytesser.py Main module for importing util.py Utility functions used by pytesser.py errors.py Interprets exceptions thrown by Tesseract tesseract.exe Executable called by pytesser.py tessdata/Resources used by tesseract.exe