対象検査:R-CNN、Fast R-CNN、Faster R-CNN


Object Detection


対象検出は,複数の事物が存在する場合に,それぞれの事物の位置やカテゴリを探す作業である.

画像ソース

オブジェクト検出方法


2-Stage Detector


  • の場所の問題を検索(ローカライズ)
  • 物体がある可能性のある位置を見つけます.
  • の画像の中で、物事が存在する可能性のある位置を見つけて羅列する過程を領域提案と呼ぶ.場所の情報を提供することを推奨します.
  • 分類問題
    各位置
  • を分類する.
  • では、回帰は、画像中の物事の存在を予測する包囲ボックスの問題である.
  • 二次検出器は、位置決めと分類を区別して順次解決する方法である.
  • 1-Stage Detector


  • の位置決め問題(位置決め)と分類問題を一度に解決します.
  • の精度は2次検出器より低い.
  • の代表的な例はYOLOである.
    -Faster R-CNNより精度は低いが、ずっと速い.
  • R-CNNシリーズ技術



    R-CNN (Regions with CNN features)

  • 選択的検索を使用して2000個の領域を抽出します.
  • 個のROIを反り、同じ大きさの入力画像に変更します.
  • Warped画像をCNNに入れ、画像の順方向特徴(ベクトル)を抽出する.
  • この特徴をSVMに入れ、分類結果を得る.
  • クラスごとに、独立して訓練されたバイナリ仮想マシンが使用されます.
  • は、この特徴を回帰機に入れ、位置(枠)を調整することによって予測する.
  • - RoI == Region proposal

    Bounding Box Regrssion


    R-CNNの限界

  • 入力画像に対してマルチCPUによる選択的探索を行うには、長い時間がかかる.
  • 全体アーキテクチャでは、SVM、RegressionrモジュールはCNNから分離されている.
    -CNNは固定されており、SVMとBoundingBox Regressionの結果でCNNを更新することはできません.
  • すべてのROIをCNNに入れるため、2000回のCNN演算が必要です.
    -学習と評価プロセスには多くの時間がかかります.

    Fast R-CNN

  • は既存のR-CNNの性能を改善した.
    -スピードが大幅に向上しました.
  • Featureマップを抽出するには、CNNを1回通過するだけです.
  • CNN構造では、特徴図は入力画像の各位置に対して一定の情報を保持している.
  • 以降、ROIプールを介して各領域について特徴情報を抽出する.
  • 基本CNNネットワークを用いてソフトmax層を経てクラス毎の確率を求める.
  • RoI Pooling Layer


    Faster R-CNN

  • 領域測位ネットワークは、GPU上で領域推奨のすべての演算を実行することを可能にする.
    -選択的検索の時間的な欠点を解決しました.
  • Feature地図を見て、どこに物体があるかを予測します.
  • 転送を1回実行するだけで、どこに物体があるか予測できます.
  • RPNは単純な物体位置提案の役割であるため,クラス全体に対して結果ではなく物体があるかどうかを示す出力は2つしかない.
  • 回帰層はboundingboxの位置を良く予測できる.
  • R-CNNシリーズ技術の発展方向とメリットとデメリット


    Region Proposal

    - Faster R-CNN은 sliding window 방식을 사용한다.

    対象検出精度測定方法


    Precision & Recall

    - 모든 영역에 대하며 전부 사물이 존재한다고 판단을 하면 재현율은 높아지지만, 정확도는 떨어진다.
    - 매우 확실할 때만 (confidence가 높을 때만) 사물이 존재한다고 판단하면 정확도는 높아지지만, 재현율은 떨어진다.

    Average Precision

    - mAP: mean average precision

    Intersection over Union (IoU)

    - IoU는 true positive인지 false positive인지 결정할 수 있는 기준이다.
    - Object detection 모델이 도출해낸 bounding box가 실제 정답 bounding box와 유사한지 평가하는 척도이다.

    NMS (Non Maximum Suppression)

    - 중복된 bounding box를 줄이는 방법이다.

    Reference


    羅東彬の論文を参考にビデオを読んでこの文章を書いた.
  • 対象検出(Object Detection)深さ学習技術:R-CNN、Fast R-CNN、Fast R-CNN発展過程核心要約(https://youtu.be/jqNCdjOB15s)
  • R-CNN: Regions with CNN features (CVPR 2014)
  • Fast R-CNN (ICCV 2015)
  • Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks (NIPS 2015)