人工知能の基本概念

2139 ワード

機械学習の中で、私たちが接触した最初のものは、機械学習に必要な前提です.
必要なデータ:トレーニングセット、テストセット、フィーチャー値.
トレーニングセット:トレーニング、すなわちモデルまたはアルゴリズムを生成するためのデータセット
   -->       ,                ,              ,      ,          ,                    ,           。

テストセット:学習したモデルまたはアルゴリズムをテストするためのデータセット
   -->    ,                     ,            。

≪フィーチャー値|Feature Value|emdw≫:プロパティの集合.通常はベクトルで表され、インスタンスに付属します.
    :     X;(X            );
       y,                  y   。
x:      
X:   ,        
    :f: X -> Y

**eg:        :**

身長
体重
髪が伸びる
年齢
性別
所属インスタンス
178cm
66kg
4.6
23

x
160cm
45kg
15.2
22

x
165cm
66kg
3.2
30

x
170cm
50kg
17.4
25

x
183cm
72kg
4.0
43

x
178cm
58kg
13.2
27

x
上記の各xが携帯する1行のデータは1つの例であり、すべてのxがX集合を構成していると仮定し、私たちの目的は1人の性別を判断することであり、上にいくつかの訓練セットが与えられている.では、上記の属性に基づいて判断することができます.上のデータから、身長、体重、年齢は人の性別をよく区別できるわけではありませんが、髪の長さで人の性別を区別することができます.男性が長髪を残す可能性があると言われていますが、この場合は確率が低く、誤差確率を大きく縮小することができます.
学習方法:監督学習、半監督学習、無監督学習.
監督学習:訓練セットにカテゴリタグ(class label)がある
         ,              (  ),        ,       ,               。               ,         。

監視なし学習:トレーニングセットに目標カテゴリタグが与えられていません
          ,            ,         ,                      ,           ,          。

半監督学習:カテゴリタグ付きトレーニングセット+タグなしトレーニングセット
身長
体重
髪が伸びる
年齢
性別
所属インスタンス
178cm
66kg
4.6
23

x
160cm
45kg
15.2
22

x
165cm
66kg
3.2
30

x
170cm
50kg
17.4
25
x
183cm
72kg
4.0
43
x
178cm
58kg
13.2
27
x
訓練セットがこの種であると仮定すると,半監督学習と呼ばれる,すなわち,ターゲット関数にはいくつかのインスタンスが与えられ,いくつかのインスタンスは与えられていない.
ターゲットタグ:分類、回帰.(いずれも監督学習に属する)
分類:ターゲットタグがカテゴリ型データ(category)、インスタンスデータを適切な分類に分割
回帰:ターゲットは連続性数値(continuous numeric value)とマークされ、主に数値型データの予測に使用されます.