Amazon Rekognition API


機械学習に関する基本的な内容をまとめてみたものです。機械学習に関する、Web上にすでにある解説コンテンツをまとめたサイトの抜粋です。
Amazon Rekognition API

APIでは何ができるのか

Amazon Rekognition では、強力で正確な画像分析をシンプルな API で利用可能にすることで、画像認識機能をアプリケーションに構築する複雑さを排除しています。

Rekognition の API は Amazon S3 のイベントに応じて AWS Lambda から直接呼び出すことができます。S3 と Lambda はアプリケーションの要求に応じて自動的にスケールするため、スケーラブルかつ信頼性の高い画像分析アプリケーションを手頃な価格で構築できます。例えば、訪問者がお客様の居住地に到着するたびに、ドアカメラはその人物の写真を S3 にアップロードし、Rekognition の API を使用してゲストを識別する Lambda 関数をトリガーできます。

物体とシーンの検出

物体とシーンの検出は、画像を分析して、視覚的な内容に基づいてラベルを割り当てるプロセスですがAmazon Rekognition では DetectLabels API でこのプロセスを実行します。この API では、数千の物体、シーン、および概念を自動的に特定して、各ラベルに対して信頼スコアを返します。DetectLabels では信頼スコアのデフォルトのしきい値は 50 です。

信頼スコアは 0 から 100 までの数字で、特定の予測がどの程度正確であるかを示します。

顔分析

Amazon Rekognition の DetectFaces API は、画像を取り込み、属性 (性別、サングラスの有無、顔の特徴など) とともに、検出された顔の境界ボックスを返します。顔分析を使用して人口統計学的な情報や感情を分析したり、検出された顔の境界ボックスを使用してさらに別の処理を行ったりできます。

DetectFaces APIでは、顔ポーズと呼んでいる、顔のピッチ軸、ロール軸、ヨー軸における、検出された顔の回転を表すパラメータも返します。これらのパラメータはそれぞれ -180 度から +180 度の間の角度として返されます。顔ポーズを使用すると、顔の境界ポリゴン (長方形の境界ボックスとは対照的) の方向性を検出し、変形の測定や、顔の正確なトラッキングなどを実行できます。

顔の比較

Amazon Rekognition では、CompareFaces API を使用して 2 つの画像内の顔が同一人物である可能性を測定します。この API は、ソースの入力画像にある顔を、ターゲットの入力画像で検出されたそれぞれの顔と比較し、各比較について類似性のスコアを返します。また、検出されたそれぞれの顔の境界ボックスと信頼スコアも取得します。顔の比較を使用すると、ほぼリアルタイムで、ファイルにある人物の写真と比較して個人のアイデンティティを検証できます。

顔認識

顔認識は、顔コレクションの中から個人の顔を探すことで、特定の個人のアイデンティティを特定、または検証するプロセスですが、Amazon Rekognition の、SearchFaces および SearchFacesByImage の API を使用することにより、アプリケーションに顔認識機能を追加することができます。SearchFaces APIは、FaceIDを使用しての検索、SearchFacesByImageは、画像による検索APIです。

顔コレクションとは、顔の特徴ベクトルの検索可能なインデックスです。CreateCollection API を使用することで、顔画像を指定するだけで、サポートされている AWS リージョンでコレクションを容易に作成することができます。

また既存の顔コレクションに顔を追加するには、IndexFaces API を使用します。この API は、S3 オブジェクトまたは画像のバイト配列の形式で画像を受け取り、検出された顔のベクトル表示を顔コレクションに追加します。