pytesserに関するいくつかの問題


ここ数日python検証コードの識別をしていますが、主にpythonのocrライブラリを運用していますが、残念ながらインストール時に多くの問題が発生し、google、stackoverflow、baiduでは効果的に解決されていません.
一、運行の主な問題は以下の通りである:
Traceback (most recent call last):
  File "C:\Users\TF-2016\Desktop\spider\ruijie\ruijie.py", line 33, in 
    print image_file_to_string('11.png', graceful_errors=True)
  File "C:\Python27\lib\site-packages\pytesser\pytesser.py", line 48, in image_file_to_string
    call_tesseract(filename, scratch_text_name_root)
  File "C:\Python27\lib\site-packages\pytesser\pytesser.py", line 23, in call_tesseract
    proc = subprocess.Popen(args)
  File "C:\Python27\lib\subprocess.py", line 710, in __init__
    errread, errwrite)
  File "C:\Python27\lib\subprocess.py", line 958, in _execute_child
    startupinfo)
WindowsError: [Error 2] 

WindowsError:[Error 2]は、一般的に信頼できるファイルが見つからないという意味です.
ソリューション:1、実行するファイルをpytesserのパッケージの下に直接置きます.2、site-packagesの下にパッケージすると、上記のような問題がずっと存在する可能性がありますが、何度もやったのか、それともそうなのか、問題はtesseractであるべきです.exe実行プログラムは環境変数ではなく、自分で変更して環境変数に直接追加することができます.怠け者は方法1のように操作すればいいです.
pytesserでpyファイルには次のものがあります.
This file must be .bmp or other Tesseract-compatible format
したがって、自分が入力ファイルをうまくサポートできない場合は、-image\_to_string()関数を直接使用すると失敗しやすい、-できるだけimage\_file\_to\_string(filename, cleanup=cleanup\_scratch\_flag, graceful\_errors=True)を使用して、最後のgraceful_に注意してください.errors=Trueは、もちろんデフォルト値が設定されており、手動で値を割り当てる必要はありません.
二、もう一つの間違いはerrorsです.pyファイルが見つかりませんtesseract.logファイル
これはpytesserでpyファイルでsubprocessを呼び出すとtesseractが実行されます.exeエンジンはエラー(すなわちtesseract.logファイルを生成していない)を返さず、必要なファイル結果も出力していない(すなわちtesseract.logのパラメータが必要な関数に入った)--回りくどいように聞こえて、とにかくバグが発生した.部分コード:
def check_for_errors(logfile="tesseract.log"):
    inf = file(logfile)
    text = inf.read()
    inf.close()
    # All error conditions result in "Error" somewhere in logfile
    if text.find("Error") != -1:
        raise Tesser_General_Exception, text

興味のある学生はプログラムのソースコードを見に行くことができて、長くありません.どうすればいいのでしょうか?
  • は簡単です.かばんの中にtesseractを見つけます.exe、ダブルクリックすればいい、tesseractが自動的に生成されます.logエラーログ.
  • tesseractを使用したい場合.exe直接認識、フォーマット
  • tesseract.exe input_filename output_filename 
    (eg:tesseract.exe default.png default)

    最後に、添付ファイル:
    1、PyTesser 2、Tesseract 3、または私の以前のcsdn上のPyTesserリソース注:ネット上にtessdataを交換する内容があるので、交換する必要はありません
    Dependencies: pytesser.py Main module for importing util.py Utility functions used by pytesser.py errors.py Interprets exceptions thrown by Tesseract tesseract.exe Executable called by pytesser.py tessdata/Resources used by tesseract.exe