AndroidにおけるTesseract OCRに基づく文字認識アプリケーション

3320 ワード

注目マイクロ信号:javalearnsいつでもどこでもJavaを学ぶ
またはスキャン
 
Android中基于Tesseract OCR的文字识别应用
 
いつでもどこでもJavaを学ぶ
一、Tesseract OCRエンジン
Tesseract OCRは、HP社が1985~1995年に開発したビジネスクラスOCR(Optical Character Reader)エンジンで、2005年にソースコードをオープンした.以下はsourceforgeのWebサイトです.
http://sourceforge.net/projects/tesseract-ocr/?source=directory
Googleのコードサービスに移行しました.
https://code.google.com/p/tesseract-ocr/
ソースとワードライブラリのダウンロードリスト:
https://code.google.com/p/tesseract-ocr/downloads/list
Googleのサーバーは国内で不安定で、http://pkgs.fedoraproject.org必要なパッケージとワードライブラリパッケージにダウンロード:
c>ソース:http://pkgs.fedoraproject.org/repo/pkgs/tesseract/tesseract-ocr-3.02.02.tar.gz/
>中国語ライブラリ:http://pkgs.fedoraproject.org/repo/pkgs/tesseract-langpack/tesseract-ocr-3.02.chi_sim.tar.gz/
>英語ライブラリ:http://pkgs.fedoraproject.org/repo/pkgs/tesseract/tesseract-ocr-3.02.eng.tar.gz/
二、Android向けのTesseractツール
tess-twoはTesseract Tools for Android(tesseract-android-tools)のコピーであり、いくつかの機能が追加されています.Tesseract Tools for AndroidはTesseract OCRとLeptonica画像処理ライブラリのAndroid APIと構築ファイルの集合である.githubのWebサイトは次のとおりです.
https://github.com/rmtheis/tess-two
tess-twoのコンパイルプロセスについては、上記のURLを参照して、私のコンパイル経験に基づいて、「android update project-path.」ステップは、コマンド「android list targets」でid値を取得し、次のように指定する-targetオプションを指定する必要があります(Android携帯電話に接続してください).
root@Leon:/home/work/tess-two# android list targets
Available Android targets:
----------
id: 1 or "android-18"
     Name: Android 4.3
     Type: Platform
     API level: 18
     Revision: 1
     Skins: WVGA854, WXGA800, WSVGA, WVGA800 (default), WQVGA400, WXGA720, QVGA, WQVGA432, WXGA800-7in, HVGA
     ABIs : armeabi-v7a
root@Leon:/home/work/tess-two# android update project --path . --target 1

そのうちの「1」はidの後ろからの値である.その後、tess-twoのgithubの説明に従ってEclispeに追加すればよい.
三、tess-twoに基づくAndroid応用
Android向けのTesseractライブラリtess-twoがあり、次はAndroidアプリを使ってテストして使用しました.githubのandroid-ocrはこのような応用です.
https://github.com/rmtheis/android-ocr
私がテストしたのはMikeからです.Wongのアプリケーションは、ソースコードのダウンロードアドレスを含む記事「android OCR文字認識の浅い分析」を参照しています.ソースコードを解凍してEclipseにインポートした後、ディレクトリの「gen」ディレクトリを削除し、プロジェクトを閉じて再開すれば、genディレクトリとその内容を再生成できます.ソースコードにはtess-twoコンパイルによって生成されるlibtessが含まれている.soとliblet.soはlibjpegを含む.so.アプリケーションをコンパイルしてインストールする前の唯一のステップは、ターゲット携帯電話のSDディレクトリの下にtessdataディレクトリを作成し、上記の中国語と英語のフォントライブラリをこのディレクトリ、すなわち「/sdcard/tessdata/」ディレクトリに追加することです.
テストの結果、アルゴリズムの実行時間はまだ遅いことがわかりました.しばらくの中国語では、処理時間は約20秒です.認識精度も限られており、1枚の写真で文字が多い場合、認識精度が低下し、文字が少なく大きくなると精度が高くなる.
注目マイクロ信号:javalearnsいつでもどこでもJavaを学ぶ
またはスキャン
 
Android中基于Tesseract OCR的文字识别应用
 
いつでもどこでもJavaを学ぶ