[AIFFEL] 22.Mar.22, GD_Data_Augmentation(Project)


今日の学習リスト

  • 移行学習時に使用するコード(特別なコードではありませんが、後で見つかるかもしれません)
  •   num_classes = ds_info.features["label"].num_classes
    resnet50 = keras.models.Sequential([
        keras.applications.resnet.ResNet50(
            include_top=False,
            weights='imagenet',
            input_shape=(224,224,3),
            pooling='avg',
        ),
        keras.layers.Dense(num_classes, activation='softmax')
    ])
    print('=3')

  • 試験時間増強(TTA)とは、増強画像を複数回表示し、各ステップについて平均予測し、結果を最終値として使用することを意味する.

  • Cross Validation
  • K-Fold Cross Validationの違いは?
  • まずcross-validationは1つのモデルの評価を訓練セットからの複数の検証セット(しかも平均味)に対して行うことを意味する
  • でもK-Foldが何回やるか教えてくれた
  • Cross Validationはなぜ使いますか?
  • データが少なく、全てのデータでトレーニングしたり、テストしたりしてより良い予測結果が得られる
  • 運転時間がKと同じくらい長いのが難点.
  • 説明リンクこれがベストな説明のようです.
  • 一番紛らわしいのは、同じモデルの訓練を続けるべきで、そうではないことだ.

  • テンソルフローを計算するときに資料のタイプが異なるわけにはいかないようです.
  • tf.constant(2) - tf.constant(1.0)川面間違い男
  • tf.strided_slice
  • テンソル流独自の滑り方を取り入れた資料型(?)そうですね.
  • tf.data.Dataset資料型変換の場合、構成化されていない場合は、先に使用すべき関数を使用して変換するため、これに関連するエラーが発生しました.
  • スモールプロジェクト

  • CutMix
  • 背景
  • p 1. "On the other hand, current methods for regional dropout remove informative pixels on training images by overlaying a patch of either black pixels or random noise. Such removal is not desirable because it leads to information loss and inefficiency during training. We therefore propose the CutMix augmentation strategy"
  • p 2. "While regional dropout strategies have shown improvements of classification and localization performances to a certain degree, deleted regions are usually zeroed-out [3, 33] or filled with random noise [51], greatly reducing the proportion of informative pixels on training images. We recognize this as a severe conceptual limitation as CNNs are generally data hungry [27]. How can we maximally utilize the deleted regions, while taking advantage of better generalization and localization using regional dropout?"
  • 意味
  • 思考データImbalance
  • tfdsから提供されたoxford_flowers102データセットを盲目的に使用した結果、合計6000枚のデータ、102クラスが発見された.
  • しかしこれを精緻にtrain、test、valに分け、少なくとも1ランクあたり10枚か20枚がコースごとに入る.
  • 考えてみると、これらをむやみにシャッフルして持ってくると、データのバランスが崩れるかも…(実はtrain、val、testにはshuffleが必要ですが、これらを合わせるとshuffleは大変なことになります…)
  • tf.image.random_brightness()max_deltaパラメータの程度を把握するために、それに似た情報を探していますtf.image.adjust_brightness()
  • "The value delta is added to all components of the tensor image. image is converted to float and scaled appropriately if it is in fixed-point representation, and delta is converted to the same data type. For regular images, delta should be in the range (-1,1), as it is added to the image in floating point representation, where pixel values are in the (0,1) range."
  • デルタは必ずしも-1から1の価格ではありません.
  • 画素値が0,1の値であると仮定した場合の話.