[Survey]Understanding How Image Quality Affects Deep Neural Networks

2703 ワード

Understanding How Image Quality Affects Deep Neural Networks

画像劣化がDeep Learningを使った画像認識の性能にどの程度影響があるかを調べた論文です。
多くのComputer VisionのApplicationは入力が比較的高画質を期待しているが、SurveillanceやMobile PhoneなどではLow Image Qualityも考慮すべき重要な要因です。
論文では、４つの最新deep neural network modelに対し、５つの劣化（Blur, Noise, JPEG, JPEG2000, Contrast)した画像を入力した時の性能を調査しています。

Model

Caffe Reference Model
VGG-CNN-S
VGG-16
CoogleNet

Distortion

Blur Gaussian Blur $\sigma=1~9$, Kernel Size=$4\sigma$
Noise Gaussian Noise 標準偏差 10~100 10刻み
Jpeg Picture Quality 2~20 2刻み (20以上は性能劣化があまり大きくない）
Jpeg2000 PSNR 20~40 2刻み
Contrast Gray imageを原画にBlending ブレンド率 0~1 0.1刻み

Distortion例

Result

結論としてはBlurとNoiseが性能劣化が大きく、残りは影響が少ない。
Networkが特定のTextureを使ってClassificationしているからBlurによりTextureがなくなると性能が悪化するのではないかとのこと。
Noiseの場合は、標準偏差が90で性能が20%以下になるが、人間ならまだ認識できるレベルとのこと。

下記は各Distortion毎のAccuracyをグラフにしたもので、横軸は右に行くほど劣化が激しくなる。

下記はDistortion毎の画像とAccuracyを列挙したもの

下記はDistortionがBlurとNoiseのVGG16のFirst Convolutional LayerとLast Convolutional Layerを可視化したもの。
Blurの場合は最初のLayerは差が小さいが、最後のLayerになると差が大きくなっている。一方Noiseは、最初のLayerで沢山Filter Responseがあり、それが後段に伝播している。

感想

Image Qualityが性能に与える影響を知っておくのは実応用上は重要な気がします。
Codeｃによる劣化が性能にあまり影響を与えなかったのは、Codecがうまく画像の特徴を残しつつ圧縮しているということなのかなと思います。
ただ各Distortion毎に横軸が異なるので、公平な比較なのかちょっと疑問が残る気がします。
劣化させた画像をつかって学習させればいいのではと思いますが、それだと綺麗な画像の時の性能が落ちるだろうとのことです。（実際にやってはいない）
知見としては有意義なのでは無いかと思います。

Author And Source

この問題について([Survey]Understanding How Image Quality Affects Deep Neural Networks), 我々は、より多くの情報をここで見つけました https://qiita.com/supersaiakujin/items/ebca62053bd69c04d6e0

著者帰属：元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。

Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .

DIVマスク効果

asp.Netcoreシリーズ23 EFモデル構成(概要、タイプと属性の含みと排除)