線形判別解析LinearDiscriminantAnalysis

1636 ワード

class  sklearn.discriminant_analysis. LinearDiscriminantAnalysis (solver=’svd’, shrinkage=None, priors=None, n_components=None, store_covariance=False, tol=0.0001)
パラメータ:
solver:最適化問題を解くアルゴリズムを指定した文字列で、次の値を指定できます.
'svd':奇異値分解.大規模な特徴を持つデータについては,このアルゴリズムを推奨する.
'lsqr':最小二乗差、skrinkageパラメータを組み合わせることができます.
'eigen':shrinkageパラメータと組み合わせることができる特徴分解アルゴリズム.
skrinkage:文字列「auto」または浮動小数点数アクティブNone.このパラメータは、通常、トレーニングサンプル数が特徴数より小さい場合に使用される.このパラメータはsolver=lsqrまたはeigenでのみ意味がある
'文字列‘auto’:Ledoit-wolf引数に基づいてshrinkageパラメータのサイズを自動的に決定します.
'None:shrinkageパラメータは使用しません.
浮動小数点数(0~1の間):shrinkageパラメータを指定します.
priors:配列の要素が各カテゴリの事前確率を順番に指定する配列.Noneであれば,クラスごとの先行確率が等可能であると考えられる.
n_components:整数です.配列が次元を下げた次元を指定します(この値はn_classes-1より小さくなければなりません).
store_covariance:ブール値.Trueの場合、各カテゴリの共分散行列をさらに計算する必要があります.
warm_start:ブール値です.Trueの場合は、前回のトレーニング結果を使用してトレーニングを続けます.そうしないと、最初からトレーニングを開始します.
tol:浮動小数点数です.SVDアルゴリズムで反復収束を評価するための閾値を指定します.
戻り値
coef_:ウェイトベクトル.
intercept:b値.
covariance_:各カテゴリの煩わしい共分散行列を順次与える配列.
means_:各カテゴリの平均ベクトルが順次与えられる配列.
xbar_:全体サンプルの平均ベクトルを与えた.
n_iter_:実際の反復回数.
方法
fix(X,y):
モデルを訓練する.
predict(X):モデルで予測し、予測値を返します.
score(X,y[,sample_weight]):(X,y)上の予測精度(accuracy)を返します.
predict_log_proba(X):配列を返し、配列の要素は一度にXが各カテゴリの確率を予測する対数値である. predict_proba(X):
配列要素は、Xが各カテゴリの確率として予測する確率値である配列を返します.
公式の説明:http://scikit-learn.org/stable/modules/generated/sklearn.discriminant_analysis.LinearDiscriminantAnalysis.html#sklearn.discriminant_analysis.LinearDiscriminantAnalysis