監視なし学習アルゴリズムの評価方法
505 ワード
目次監視なし学習アルゴリズム を評価するコード 監視なし学習アルゴリズムの評価
無監督学習アルゴリズムは予測もy値も存在しないため,モデル予測の精度に直接基づいて評価することはできない.クラスタリングアルゴリズムを例にとると,「肘法則」を用いて目測を行うが,統計量が必要である.プロファイル係数(silhouette coefficient)は、クラスタ分離を表す変数であり、−1〜1の値をとり、クラスタアルゴリズムの優位性を定性的に解析するために使用することができる.
コード#コード#
Pythonとscikit-learnで輪郭係数を計算するコードは以下の通りです.
無監督学習アルゴリズムは予測もy値も存在しないため,モデル予測の精度に直接基づいて評価することはできない.クラスタリングアルゴリズムを例にとると,「肘法則」を用いて目測を行うが,統計量が必要である.プロファイル係数(silhouette coefficient)は、クラスタ分離を表す変数であり、−1〜1の値をとり、クラスタアルゴリズムの優位性を定性的に解析するために使用することができる.
コード#コード#
Pythonとscikit-learnで輪郭係数を計算するコードは以下の通りです.
attributes = tabular_data
cluster_labels = outputted_labels_from_clustering
from sklearn.metrics import silhouette_score
silhouette_score(attributes, cluster_labels)