監視なし学習アルゴリズムの評価方法

505 ワード

目次
  • 監視なし学習アルゴリズム
  • を評価する
  • コード
  • 監視なし学習アルゴリズムの評価
    無監督学習アルゴリズムは予測もy値も存在しないため,モデル予測の精度に直接基づいて評価することはできない.クラスタリングアルゴリズムを例にとると,「肘法則」を用いて目測を行うが,統計量が必要である.プロファイル係数(silhouette coefficient)は、クラスタ分離を表す変数であり、−1〜1の値をとり、クラスタアルゴリズムの優位性を定性的に解析するために使用することができる.
    コード#コード#
    Pythonとscikit-learnで輪郭係数を計算するコードは以下の通りです.
    attributes = tabular_data
    cluster_labels = outputted_labels_from_clustering
    
    from sklearn.metrics import silhouette_score
    silhouette_score(attributes, cluster_labels)