人工知能の基本概念

2139 ワード

Artificial

機械学習の中で、私たちが接触した最初のものは、機械学習に必要な前提です.
必要なデータ:トレーニングセット、テストセット、フィーチャー値.
トレーニングセット:トレーニング、すなわちモデルまたはアルゴリズムを生成するためのデータセット

   -->       ，                ，              ，      ，          ，                    ，           。

テストセット:学習したモデルまたはアルゴリズムをテストするためのデータセット

   -->    ，                     ，            。

≪フィーチャー値|Feature Value|emdw≫:プロパティの集合.通常はベクトルで表され、インスタンスに付属します.

    ：     X；（X            ）；
       y，                  y   。
x:      
X:   ,        
    ：f: X -> Y

**eg：        ：**

身長
体重
髪が伸びる
年齢
性別
所属インスタンス
178cm
66kg
4.6
23
男
x
160cm
45kg
15.2
22
女
x
165cm
66kg
3.2
30
男
x
170cm
50kg
17.4
25
女
x
183cm
72kg
4.0
43
男
x
178cm
58kg
13.2
27
女
x
上記の各xが携帯する1行のデータは1つの例であり、すべてのxがX集合を構成していると仮定し、私たちの目的は1人の性別を判断することであり、上にいくつかの訓練セットが与えられている.では、上記の属性に基づいて判断することができます.上のデータから、身長、体重、年齢は人の性別をよく区別できるわけではありませんが、髪の長さで人の性別を区別することができます.男性が長髪を残す可能性があると言われていますが、この場合は確率が低く、誤差確率を大きく縮小することができます.
学習方法:監督学習、半監督学習、無監督学習.
監督学習:訓練セットにカテゴリタグ(class label)がある

         ，              （  ），        ，       ，               。               ，         。

監視なし学習:トレーニングセットに目標カテゴリタグが与えられていません

          ，            ，         ，                      ，           ，          。

半監督学習:カテゴリタグ付きトレーニングセット+タグなしトレーニングセット
身長
体重
髪が伸びる
年齢
性別
所属インスタンス
178cm
66kg
4.6
23
男
x
160cm
45kg
15.2
22
女
x
165cm
66kg
3.2
30
男
x
170cm
50kg
17.4
25
x
183cm
72kg
4.0
43
x
178cm
58kg
13.2
27
x
訓練セットがこの種であると仮定すると,半監督学習と呼ばれる,すなわち,ターゲット関数にはいくつかのインスタンスが与えられ,いくつかのインスタンスは与えられていない.
ターゲットタグ:分類、回帰.(いずれも監督学習に属する)
分類:ターゲットタグがカテゴリ型データ(category)、インスタンスデータを適切な分類に分割
回帰:ターゲットは連続性数値(continuous numeric value)とマークされ、主に数値型データの予測に使用されます.

python opencvポリゴンマスク(Mask)

pythonバッチリモートマシン、Linuxコマンド実行