pythonに基づいてROC曲線描画広場解析を実現します。


ROC
結果

ソースデータ:トビの花データセット(その中の二つの種類の花だけを使って訓練と測定を行います。)
Summary
feat ures:''sepal length(cm)'sepal width(cm)'、'petal length(cm)'
実例:[5.1,3.5,1.4,0.2]
target:'setora''vericolor'(0,1)
回帰法を用いてフィッティングしてパラメータとbiasを得た。model.fit(data_train, data_train_label)試験データを予測して確率値を得るres = model.predict(data[:100])トレーニングセットのlabelsに合わせて並べ替えを行います。(大きいから小さいまで)

    pred labels
68 0.758208    1
87 0.753780    1
76 0.745833    1
50 0.743156    1
65 0.741676    1
75 0.739117    1
62 0.738255    1
54 0.737036    1
52 0.733625    1
77 0.728139    1
86 0.727547    1
74 0.726261    1
58 0.725150    1
71 0.724719    1
36 0.724142    0
14 0.723990    0
31 0.721648    0
41 0.720308    0
72 0.717723    1
79 0.712833    1
97 0.705148    1
51 0.702838    1
35 0.702203    0
98 0.701731    1
92 0.701106    1
82 0.700661    1
53 0.700465    1
18 0.699350    0
16 0.696915    0
64 0.693333    1
..    ...   ...
33 0.658937    0
96 0.656761    1
30 0.656279    0
57 0.655673    1
4  0.652616    0
85 0.648620    1
59 0.648586    1
19 0.646965    0
70 0.646262    1
88 0.644482    1
8  0.643191    0
38 0.642704    0
3  0.640933    0
55 0.640630    1
47 0.640444    0
95 0.639552    1
13 0.639050    0
22 0.638485    0
29 0.635590    0
90 0.634376    1
37 0.632224    0
6  0.631119    0
46 0.630037    0
11 0.629718    0
66 0.627807    1
42 0.624795    0
44 0.621703    0
32 0.614932    0
24 0.603874    0
84 0.603249    1
トレーニングセットの正しい個数と不正な個数を計算します。
TPRとFSRの計算を使って行います。

index = 0
for i in sorted_mat.values:
  if i[1] == 0:
    TPR.append(TPR[index])
    FPR.append(FPR[index] + 1.0/F_num)
  else:
    TPR.append(TPR[index] + 1.0/T_num)
    FPR.append(FPR[index])
  index += 1
最後にTPRとFSRの描写を行います。
以上が本文の全部です。皆さんの勉強に役に立つように、私たちを応援してください。