👩🏻‍💻Standford CS231N Deep Learning -2


2020年09月05日ダウンジャケットブログ記録

2. Image Classification


画像分類の難点

  • 意味gap:ピクチャはピクチャではなく、デジタルビュー
  • viewpoint variation
  • background clutter
  • Illumination:輝度またはシャドウ
  • 遮蔽:他のものに遮られて区別しにくい
  • deformation
  • 内部変異:同じ種類だが顔が異なる
  • イメージからedgeを抽出する方向を考慮したが,あまりにも不安定で状況が多様であるため効率的ではない.
    そこで,データ駆動法を用いて画像セットにラベルを付け,新しい画像を区別するために機械の学習モデルを訓練する.
  • CIFAR10 data set
    - 10 classes
    - 50,000 trn-img
    - 10,000 tst-img
    - 32*32 piexel
  • Nearest Neighbor


  • L1 distance (Manhattan)
    	- Train O(1) , Predict O(N)
    	-> **훈련을 느리게하고, 예측을 빠르게 할 순 없을까?**

  • KNN
    - majority vote

  • L2 distance (Euclidean)


  • Hyper-parameter
    アルゴリズムのために選んだもの
    - problem dependent -> try and pick!
    - k, distance matrix...
    -dataset->train、validation、test
    1.trainで各種モデルを学習する(スーパーパラメータを変えることによって)
    2.vaildaionを使用して最適なモデルを選択
    3.モデルをテストで評価します.
    - cross-validation
    この例は5倍です
    -foldの検証を回避して効率を向上
    -深い学習でデータが大きすぎて使いにくい
    何度も検証するのがメリット?
  • Linear Classification

  • parametric model
    - W, weight
    - f(x,W)f(x, W)f(x,W)
    -f(x,w)=Wx+bf(x,w)=Wx+bf(x,w)=Wx+b(bはbias)

    (CIFAR 10線形分類のW)
  • 身動き


    knnアルゴリズムは機械学習で、学校ですでに学んだので、複雑ではありません.クロス検証は少し混同しています.もう一度探してみなければなりません.
    私はL 2を画像比較に使うことをずっと理解していなかったが、最後にKNNは画像に使わないアルゴリズムだと教授に言われたので、もう考えないことにした.画素の類似性はL 2...
    聞いてみるとメモが細かく書かれているので、今度の授業は耳を傾けて、メモを読みましょう.課題を終えて寝るぞ!