R言語相関分析とロバスト線形回帰分析
テキストリンク:http://tecdat.cn/?p=9484
目次
テスト方法
でんりょくぶんせき
紹介する
次に,種多様性を例として,R言語における相関解析と線形回帰解析の方法を示す.
テスト方法
相関および線形回帰の例
データ単純図
関連性
cor.test関数を使用できます.Pearson、Kendall、Spearman関連を実行できます.
ピルソン関係
ピルソン相関は最も一般的な相関形式である.データは線形に相関し,残差は正規分布を示すと仮定した.
ケンデル関連
ケンデルランク相関は非パラメータ検査であり,データの分布やデータが線形相関であると仮定しない.データをランキングして、関連度を決定します.
スピルマン関連
Spearmanクラス相関は,データの分布またはデータが線形相関であると仮定しない非パラメータ検査である.データを並べ替えて相関度合いを決定し,順序測定に適している.
せんけいかいき
線形回帰はlm関数を使用して実行できます.安定回帰はlmrob関数を用いて実行できます.
線形回帰の描画
モデルの仮定をチェック
線形モデルの残差のヒストグラム.これらの残差の分布は正規に近似すべきである.
残差と予測値の関係図.残差は偏りがなく均等であるべきである.
安定した回帰
この線形回帰は応答変数の異常値に敏感ではない.
モデルの描画
線形回帰の例
でんりょくぶんせき
パワー解析の相関
目次
テスト方法
でんりょくぶんせき
紹介する
次に,種多様性を例として,R言語における相関解析と線形回帰解析の方法を示す.
テスト方法
相関および線形回帰の例
Data = read.table(textConnection(Input),header=TRUE)
データ単純図
plot(Species ~ Latitude,
data=Data,
pch=16,
xlab = "Latitude",
ylab = "Species")
関連性
cor.test関数を使用できます.Pearson、Kendall、Spearman関連を実行できます.
ピルソン関係
ピルソン相関は最も一般的な相関形式である.データは線形に相関し,残差は正規分布を示すと仮定した.
cor.test( ~ Species + Latitude,
data=Data,
method = "pearson",
conf.level = 0.95)
Pearson's product-moment correlation
t = -2.0225, df = 15, p-value = 0.06134
cor
-0.4628844
ケンデル関連
ケンデルランク相関は非パラメータ検査であり,データの分布やデータが線形相関であると仮定しない.データをランキングして、関連度を決定します.
cor.test( ~ Species + Latitude,
data=Data,
method = "kendall",
continuity = FALSE,
conf.level = 0.95)
Kendall's rank correlation tau
z = -1.3234, p-value = 0.1857
tau
-0.2388326
スピルマン関連
Spearmanクラス相関は,データの分布またはデータが線形相関であると仮定しない非パラメータ検査である.データを並べ替えて相関度合いを決定し,順序測定に適している.
せんけいかいき
線形回帰はlm関数を使用して実行できます.安定回帰はlmrob関数を用いて実行できます.
summary(model) # shows parameter estimates,
# p-value for model, r-square
Estimate Std. Error t value Pr(>|t|)
(Intercept) 585.145 230.024 2.544 0.0225 *
Latitude -12.039 5.953 -2.022 0.0613 .
Multiple R-squared: 0.2143, Adjusted R-squared: 0.1619
F-statistic: 4.09 on 1 and 15 DF, p-value: 0.06134
Response: Species
Sum Sq Df F value Pr(>F)
Latitude 1096.6 1 4.0903 0.06134 .
Residuals 4021.4 15
線形回帰の描画
plot(Species ~ Latitude,
data = Data,
pch=16,
xlab = "Latitude",
ylab = "Species")
abline(int, slope,
lty=1, lwd=2, col="blue") # style and color of line
モデルの仮定をチェック
線形モデルの残差のヒストグラム.これらの残差の分布は正規に近似すべきである.
残差と予測値の関係図.残差は偏りがなく均等であるべきである.
安定した回帰
この線形回帰は応答変数の異常値に敏感ではない.
summary(model) # shows parameter estimates, r-square
Estimate Std. Error t value Pr(>|t|)
(Intercept) 568.830 230.203 2.471 0.0259 *
Latitude -11.619 5.912 -1.966 0.0681 .
Multiple R-squared: 0.1846, Adjusted R-squared: 0.1302
anova(model, model.null) # shows p-value for model
pseudoDf Test.Stat Df Pr(>chisq)
1 15
2 16 3.8634 1 0.04935 *
モデルの描画
線形回帰の例
summary(model) # shows parameter estimates,
# p-value for model, r-square
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 12.6890 4.2009 3.021 0.0056 **
Weight 1.6017 0.6176 2.593 0.0154 *
Multiple R-squared: 0.2055, Adjusted R-squared: 0.175
F-statistic: 6.726 on 1 and 26 DF, p-value: 0.0154
### Neither the r-squared nor the p-value agrees with what is reported
### in the Handbook.
library(car)
Anova(model, type="II") # shows p-value for effects in model
Sum Sq Df F value Pr(>F)
Weight 93.89 1 6.7258 0.0154 *
Residuals 362.96 26
# # #
でんりょくぶんせき
パワー解析の相関
### --------------------------------------------------------------
### Power analysis, correlation
### --------------------------------------------------------------
pwr.r.test()
approximate correlation power calculation (arctangh transformation)
n = 28.87376