C# および .NET でのタミル OCR

2866 ワード

このドキュメントの他のバージョン:
  • தமிழில்
  • 125 More OCR Languages

  • IronOCR は、.NET コーダーがタミル語を含む 126 の言語で画像や PDF ドキュメントからテキストを読み取ることを可能にする C# ソフトウェア コンポーネントです.

    これは、.NET 開発者専用に構築された Tesseract の高度なフォークであり、速度と精度の両方で他の Tesseract エンジンよりも優れています.

    IronOcr.Languages.Tamil の内容



    このパッケージには、.NET 用の 102 の OCR 言語が含まれています.
  • タミル語
  • タミルベスト
  • タミルファースト
  • タミル語アルファベット
  • タミル語アルファベットベスト
  • タミル語AlphabetFast

  • ダウンロード



    タミル語パック [தமிழ்]



    インストール



    最初に、Tamil OCR パッケージを .NET プロジェクトにインストールする必要があります.
    PM> Install-Package IronOCR.Languages.Tamil

    コード例



    この C# コードの例では、画像または PDFv ドキュメントからタミル語のテキストを読み取ります.

    C#:

    //PM> Install-Package IronOcr.Languages.Tamil
    using IronOcr;
    var Ocr = new IronTesseract();
    Ocr.Language = OcrLanguage.Tamil;
    using (var Input = new OcrInput(@"images\Tamil.png"))
    {
        var Result = Ocr.Read(Input);
        Var AllText =  Result.Text
    }
    


    VB:

    'PM> Install-Package IronOcr.Languages.Tamil
    Imports IronOcr
    Private Ocr = New IronTesseract()
    Ocr.Language = OcrLanguage.Tamil
    Using Input = New OcrInput("images\Tamil.png")
        Dim Result = Ocr.Read(Input)
        Dim AllText As Var = Result.Text
    End Using