[ML]機械学習の概要(第2部)


マシンラーニングコンポーネント


大学の授業で聞いたことのあるMLの授業の整理.

機械学習とは何ですか。


A computer program is said to learn from experience E
with respect to some class of tasks T
and performance at tasks in T, as measured by P,
improves with experience E.
-Tom Michell
直訳すると、コンピュータプログラムは性能指標とどのような分類を考慮した経験に基づいて学習し、これらの経験に基づいて学習して性能を改善します(そうですか?)このように形容することができる.

では、データとは何ですか。


Raw Dataはどんなものになりますか?!
これらを含めるには
  • ID(またはキー)値
  • IDごとに複数の変数
  • が必要である.
  • 特性の観察変数
  • IDで変化する変数
  • 気になること

    MLのアルゴリズム


    モデリングのタイプ


    機械学習のパターンは4種類ほどあります.その中で指導学習と非指導学習が大きな比重を占めている.他の2種類は異常値検出と強化学習である.

    学習を指導する.


    予測のある出力変数(target y)の学習を指導し,入力と出力の関係を探して予測モデル(?)を構築する.
    学習を指導する.
  • 予測
  • 分類
  • 回帰
  • に分かれる.

    ぶんかつ


    分類は,ターゲットyが持つことができる値が限られている場合に行う分類である.
    たとえば、視覚データ(元のデータ)を男女別に区別するとします.この場合、髪の長さと身長をカテゴリにして、グラフで表すと、男女を区別するために線を探す過程を分類と呼ぶことができます.このほかにも、文字認識やナンバープレート認識など、多くの例があります.

    分類を用いる方法としては,Navieve Bays分類,Neural Network,サポートベクトルマシン,KNN,意思決定ツリーなどがある.

    回帰(Regression)


    回帰は、ターゲットyが有する可能性のある値が実数である場合の回帰である.フィーチャー量に基づく分割線の検索方法を実行します.
    例えば、スーパーの顧客の年俸データを持っていて、スーパーで使ったお金を連続的にyで表しています.このとき,年俸による消費金額を直線として表すために回帰解析を用いた.

    回帰を用いる方法としては,線形回帰,多重線形回帰,RidgeとLasso回帰,Neural Network回帰,Support Vector回帰,Decision Tree回帰などがある.

    指導なし学習(監督なし学習)


    非指導学習は出力(target y)が存在せず,入力のみを用いて予測モデルを構築する.Inputデータはクラスタ化/分布測定によりinputをグループ化し,これをクラスタリング法と呼ぶ.

    異常検出


    異常検出とは、正常なデータから逸脱した検出を指す.データでは、異常値データの収集が困難な場合がある.これらのデータを検出するために、正常値領域を学習します.異常値データから以降の学習領域以外のデータを判断する.

    学習を強化する.


    強化学習は主にゲームに用いられる.エージェント(システム)は状態に応じて動作するとリアルタイムで奨励を受ける.このリアルタイムインセンティブは、さまざまな動作に基づいて与える必要があり、仮想環境で使用するのに非常に適しています.代表的な例はAlphaGo

    次元の折りたたみ


    次元縮小は主に変数の数が多い場合に使われるという.変数が多ければ多いほど、不要な変数がモデルに与える影響が大きくなります.したがって,これらの負の影響を低減するためには,次元を適切に縮小する必要がある.

    それ以外は..。


    このほか、高容量モデルRNN、CNNもある.詳細は後で話します.

    現実の生活の中で...?


    実生活で適用される分野は様々だそうです.教室で提案されているのは画像/ビデオ認識、自然言語処理、言語認識、業界予測報酬(?)医療分野、公共分野など多様である.

    終了後..。


    2回に分けてMLレッスンの第1週目の内容を整理しました.まだ本格的に内容に触れていないので、物足りなさそうですが、まだ始まったばかりなので、本当に楽しみです.😁