DS起動サマーキャンプ次営業日



1.SQL試験の準備

  • LIMIT:入力時に出力される行数を限定する役割
  • selct column1
    from table
    Limit 5;
    -- table에서 column1을 보여주는데 5개만
    selct column1
    from table
    offset 2
    limit 5;
    -- table에서 column1을 보여주는데 3부터 5개만
  • FETCH:入力時に出力される行数を限定する役割
  • selct column1, column2
    from table
    ORDER BY column1 desc
    FETCH FIRST 5 ROW ONLY;
    -- table에서 column1, column2을 보여주는데 column1 내림차순으로 5개만
    selct column1, column2
    from table
    ORDER BY column1 desc
    FETCH FIRST 5 ROW ONLY;
    -- table에서 column1, column2을 보여주는데 column1 내림차순으로 5개만

    2. Kernel Study


    李侑漢さん、タイタニック研究1
  • Binary Classification
  • 特徴タイプによる方法
    (categorical(One-Hot Encoder), numerical, ordinal(Label Encoder))
  • value_counts()活用
  • 3.論文を読む


    AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

    Introduction :


    Transfomerは自然言語処理に優れている.大量のテキスト語彙を事前に訓練し、特定の自然言語を処理するために小さな単位をfine-tuningする.Transformerは計算効率と拡張性を持ち,データサイズにかかわらず大量のパラメータを訓練できる.
    しかし,コンピュータビジュアルの分野では,ボリュームアーキテクチャが多くの選択を受けている.CNNのような建物を自己注意と結びつけたり、完全に自己注意で代用したりするのは、理論的には効率的だが、まだ拡大していない.だからResNetのようなアーキテクチャはSOTAです
    実験は基本Transformerを画像の最小修正に直接適用した.画像をpatchに分け,線形埋め込みシーケンスを入力とする.自然言語処理では、この画像patcheをtokenと見なす.
    中型データセットでは,失望した結果の帰納偏差(直面しないデータの仮定をよりよく予測するために)不足が期待され,CNN上で翻訳対の等差と位置を見つけることができる.
    しかし、大きなデータセット(14 M-300 M画像)では異なる.大量のプレゼンテーションVision Transformer(VT)は、優れたパフォーマンスを提供します.

    4.面接問題


    時間の割り当てに失敗しました

    5.テストコード


    時間の割り当てに失敗しました