Pythonは複数の特徴間の相関を計算する

1084 ワード

線形相関:主にピルソン相関係数を用いて連続変数間の線形相関強度を測定する.
線形相関係数|r|相関程度
0<=|r|<0.3低度相関
0.3<=|r|<0.8中度相関
0.8<=|r|<1高さ相関
1関数
関連分析関数:
DataFrame.corr() Series.corr(other)
説明:corrメソッドがデータ・ボックスで呼び出されると、各カラムの2つの類似度が計算されます.
シーケンスによってcorrメソッドが呼び出される場合、シーケンスと受信シーケンスとの相関を計算するだけです.
戻り値:dataFrame呼び出し:戻りDataFrame Series呼び出し:数値型を返し、サイズは相関度
2ケース
import pandas

data=pandas.read_csv('C:\\Users\\Desktop\\test.csv')

print(data.corr())  
#      corr  ,               ,        

print(data['  '].corr(data['   ']))   
#      corr  ,            (    '   ')      

print(data['     ','     ','   ','  ']).corr()
#            

3データFrameデータの読み出し
結果のタイプはprint(type(data.corr()))で確認できます.
結果の行数と列数をprint(len(data,corr()))で表示することもできます.
各カラムには名前があり、名前を指定してカラムの値を表示できます.
res = data.corr()

res['a']            # a  

res[['a','b']]     # a、b 

数値インデックスを使用することもできます
print(res[0:5])
相関結果の最初の5行のデータが出力されます