Mindeeの機械学習APIによるレシートの解析

22064 ワード

経費報告書を提出した誰でも、あなたに言うことができます:レシート追跡と経費記録は頭痛です.は、自動的に、正確に瞬時にあなたの領収書の詳細を解析する深い学習を使用してMindeeの領収書の解析APIを入力します.

このチュートリアルでは、MinDeeのレシート解析APIを使用する手順を実行します.ええ、始めましょう!畝

API必須条件

  • あなたは無料Mindeeアカウントが必要になります.サインアップし、ログインにあなたのメールを確認します.
  • 領収書.あなたのバッグ/財布の最近のいずれかを見て、または領収書のためのGoogle画像検索を行い、いくつかをテストするためにダウンロードします.


    -
    APIの設定

    Mindeeアカウントにログインして、経費領収書カードをクリックすることによってあなたの経費領収書API環境にアクセスしてください

    APIをアクティブにするには、私たちの寛大なフリー層にアクセスするために“無料でお試しください”ボタンをクリックしてください.ダッシュボードのページに着陸します-ここではすぐにAPIの使用状況を見ることができます(あなたは今、何も持っていないが、それは変更されます).左のナビゲーションでは、“ドキュメント”、“資格情報”と“ライブインターフェイス”へのリンクがあります.タブは、レシートAPIのエンドポイントのために構築する必要がありますすべての技術的な詳細を持って、ライブインターフェイスは、クールなインタラクティブなデモです.デモを試してみるのではなく、APIを使ってビルドしたいのです.

    新しいトークンを追加します.この例では、「チュートリアル」と名付けました.


    「新しいキーを追加」をクリックすると、APIトークンを見ることができます.

    さて、APIコールを作成する準備ができました.この例では、curlを使います.

    curl -X POST \ https://api.mindee.net/products/expense_receipts/v2/predict 
    
    -H 'X-Inferuser-Token: {apiToken}’ \
    
    -H 'content-type: multipart/form-data; boundary=----WebKitFormBoundary7MA4YWxkTrZu0gW' \
    
    -F file=@/path/to/your/file.png
    

    単に置換{apiToken}あなたの新しいAPIトークンと/path/を使って、あなたの領収書へのパスを使用します.畝

    NOTE: You can also copy this code right from the documentation tab of the API with your API token inserted for you.



    この例では、Koln空港の食料品店(2020年の最後の出張)から領収書を使いました.


    私の端末にカールサンプルを貼って、私はEnterをヒットし、約1秒後、私は領収書の詳細とJSON応答を受けた.応答は全く冗長であるので、セクションによって様々な分野のセクションを歩きます.

    APIレスポンス:解析結果



    概要・文書部門



    レスポンスの最初の2つのセクションは、作られたAPI呼び出しに関する情報を含みます.

    "call": {
        "endpoint": {
            "name": "expense_receipts",
            "version": "2.1"
        },
        "finished_at": "2020-08-29T18:01:22+00:00",
        "id": "e47d8654-0df7-4839-a282-2c04bf293886",
        "n_documents": 1,
        "n_inputs": 1,
        "processing_time": 1.087,
        "started_at": "2020-08-29T18:01:21+00:00"
    },
    "documents": [
        {
        "id": "66d9adc6-76cf-4c42-8622-3dadb660ac32",
        "name": "IMG_20200301_073354.jpg"
        }
    ],
    

    呼び出しセクションでは、私たちは費用の領収書のエンドポイントで、1つのページの長さが1つのドキュメントをアップロードして実行し、約1秒後に、ファイルが処理されたことを教えてください.ドキュメントセクションでは、ファイルのmindee IDとファイル名を指定します.

    予測:



    今、我々はエキサイティングなものになっている.予測セクションはいくつかのセクションに分けられます.これらのいくつかのいくつかは、領収書のフィールドを識別し、他の受信機から情報を推論する機械学習を使用している.各セクションを通して行きましょう.

    カテゴリ



    category": {
         "probability": 0.51,
         "value": "miscellaneous"
    },
    

    APIは購入のタイプを予測する.このケースでは、それは雑多な51 %確かです.可能なカテゴリは、[料金、食料、駐車場、交通機関、宿泊施設、ガソリン、雑多な]です.

    日付



    受信したテキストから識別され、ISO形式に変換されます.この購入は2020年2月3日に行われました、そして、モデルはその選択で99 %の自信があります.○セグメントの境界ボックスは4(x,y)座標を受け取ります.(0,0)は、(0,0)がレシートから引いた場所を示します.

    "date": {
        "iso": "2020-02-03",
        "probability": 0.99,
        "raw": "03-02-2020",
        "segmentation": {
        "bounding_box": [
          [0.64,0.661],
          [0.801,0.661],
          [0.801,0.686],
          [0.64,0.686]
      ]
    }
    

    ロケール



    データを使用して、残りの領収書は、APIを購入することができますどこで購入された、言語と通貨:.最新のサポートのドキュメントをチェックしてください.執筆時には、ヨーロッパと北アメリカ  を中心にサポートしています.

    "locale": {
        "country": "DE",
        "currency": "EUR",
        "language": "de",
        "probability": 0.77,
        "value": "de-DE"
    },
    

    私の領収書の場合、それはドイツで購入され、ドイツで作られ、ユーロでは、77 %確信しています.

    商人



    "merchant": {
        "name": "REWE",
        "probability": 0.91,
        "segmentation": {
        "bounding_box": [
          [0.279, 0.135],
          [0.719, 0.135],
          [0.719,0.23],
          [0.279,0.23]
         ]
    }
    
    APIは正しく(それは91 %確信していた)rerestoreだったと予測した.もう一度、4(x、y)ポイントは、イメージの上で商人に命名するテキストの位置をマークします.

    方向



    "orientation": {
       "degrees":0,
       "probability": 0.99
    },
    
    ドキュメントは構文解析する前に回転を必要としましたか?は、90度単位で測定した.この場合,回転は不要であった.

    税金



    "taxes": [],
    

    税金が領収書で特定されるならば、意志はここに現れます.この場合、勘定はない.

    時間



    "time": {
        "iso": "15:50",
        "probability": 0.99,
        "raw": "15:50",
        "segmentation": {
        "bounding_box": [
          [0.649,0.898],
          [0.732,0.898],
          [0.732,0.925],
          [0.649,0.925]
        ]
    }
    

    領収書、印刷された時間、および(x、y)のイメージのフィールドにバインドされた座標.

    トータル



    おそらく、領収書の最も重要な部分は、合計を使用して、一緒に、自信とボックスの領収書の場所を示す.

    "total": {
        "amount": 17.74,
        "probability": 0.99,
        "segmentation": {
        "bounding_box": [
         [0.663,0.589],
         [0.765,0.589],
         [0.765,0.617],
         [0.663,0.617]
       ]
    }
    


    概要



    ちょうど1秒以上で、領収書はアップロードされました.私たちは、17.74が1720年2月3日に15時50分にドイツのレイルで使われたことを知っています.対角ボックスを使用して、我々はユーザーが値を検証することができますし、経費管理システムにこのデータを入力します.  

    結論



    Mindee領収書の解析APIを使用すると、すぐに領収書を検証することができます、より速く、より正確な(そして、より辛い)我々のユーザーのための費用管理を可能にする.質問がある場合は、右下のチャットウィジェットで私たちに手を差し伸べてください.