人工知能の基本概念
2139 ワード
機械学習の中で、私たちが接触した最初のものは、機械学習に必要な前提です.
必要なデータ:トレーニングセット、テストセット、フィーチャー値.
トレーニングセット:トレーニング、すなわちモデルまたはアルゴリズムを生成するためのデータセット
テストセット:学習したモデルまたはアルゴリズムをテストするためのデータセット
≪フィーチャー値|Feature Value|emdw≫:プロパティの集合.通常はベクトルで表され、インスタンスに付属します.
身長
体重
髪が伸びる
年齢
性別
所属インスタンス
178cm
66kg
4.6
23
男
x
160cm
45kg
15.2
22
女
x
165cm
66kg
3.2
30
男
x
170cm
50kg
17.4
25
女
x
183cm
72kg
4.0
43
男
x
178cm
58kg
13.2
27
女
x
上記の各xが携帯する1行のデータは1つの例であり、すべてのxがX集合を構成していると仮定し、私たちの目的は1人の性別を判断することであり、上にいくつかの訓練セットが与えられている.では、上記の属性に基づいて判断することができます.上のデータから、身長、体重、年齢は人の性別をよく区別できるわけではありませんが、髪の長さで人の性別を区別することができます.男性が長髪を残す可能性があると言われていますが、この場合は確率が低く、誤差確率を大きく縮小することができます.
学習方法:監督学習、半監督学習、無監督学習.
監督学習:訓練セットにカテゴリタグ(class label)がある
監視なし学習:トレーニングセットに目標カテゴリタグが与えられていません
半監督学習:カテゴリタグ付きトレーニングセット+タグなしトレーニングセット
身長
体重
髪が伸びる
年齢
性別
所属インスタンス
178cm
66kg
4.6
23
男
x
160cm
45kg
15.2
22
女
x
165cm
66kg
3.2
30
男
x
170cm
50kg
17.4
25
x
183cm
72kg
4.0
43
x
178cm
58kg
13.2
27
x
訓練セットがこの種であると仮定すると,半監督学習と呼ばれる,すなわち,ターゲット関数にはいくつかのインスタンスが与えられ,いくつかのインスタンスは与えられていない.
ターゲットタグ:分類、回帰.(いずれも監督学習に属する)
分類:ターゲットタグがカテゴリ型データ(category)、インスタンスデータを適切な分類に分割
回帰:ターゲットは連続性数値(continuous numeric value)とマークされ、主に数値型データの予測に使用されます.
必要なデータ:トレーニングセット、テストセット、フィーチャー値.
トレーニングセット:トレーニング、すなわちモデルまたはアルゴリズムを生成するためのデータセット
--> , , , , , , 。
テストセット:学習したモデルまたはアルゴリズムをテストするためのデータセット
--> , , 。
≪フィーチャー値|Feature Value|emdw≫:プロパティの集合.通常はベクトルで表され、インスタンスに付属します.
: X;(X );
y, y 。
x:
X: ,
:f: X -> Y
**eg: :**
身長
体重
髪が伸びる
年齢
性別
所属インスタンス
178cm
66kg
4.6
23
男
x
160cm
45kg
15.2
22
女
x
165cm
66kg
3.2
30
男
x
170cm
50kg
17.4
25
女
x
183cm
72kg
4.0
43
男
x
178cm
58kg
13.2
27
女
x
上記の各xが携帯する1行のデータは1つの例であり、すべてのxがX集合を構成していると仮定し、私たちの目的は1人の性別を判断することであり、上にいくつかの訓練セットが与えられている.では、上記の属性に基づいて判断することができます.上のデータから、身長、体重、年齢は人の性別をよく区別できるわけではありませんが、髪の長さで人の性別を区別することができます.男性が長髪を残す可能性があると言われていますが、この場合は確率が低く、誤差確率を大きく縮小することができます.
学習方法:監督学習、半監督学習、無監督学習.
監督学習:訓練セットにカテゴリタグ(class label)がある
, ( ), , , 。 , 。
監視なし学習:トレーニングセットに目標カテゴリタグが与えられていません
, , , , , 。
半監督学習:カテゴリタグ付きトレーニングセット+タグなしトレーニングセット
身長
体重
髪が伸びる
年齢
性別
所属インスタンス
178cm
66kg
4.6
23
男
x
160cm
45kg
15.2
22
女
x
165cm
66kg
3.2
30
男
x
170cm
50kg
17.4
25
x
183cm
72kg
4.0
43
x
178cm
58kg
13.2
27
x
訓練セットがこの種であると仮定すると,半監督学習と呼ばれる,すなわち,ターゲット関数にはいくつかのインスタンスが与えられ,いくつかのインスタンスは与えられていない.
ターゲットタグ:分類、回帰.(いずれも監督学習に属する)
分類:ターゲットタグがカテゴリ型データ(category)、インスタンスデータを適切な分類に分割
回帰:ターゲットは連続性数値(continuous numeric value)とマークされ、主に数値型データの予測に使用されます.