(2022-12-08 初稿 )
先日、必要に迫られて初めてRを使って分散分析とTukey体重検定を行ったので、その時のメモ。
なお、このページには必要最低限のことしか書いてないので、気が向いたら追記するつもり。
なお、当方の環境は以下のとおり。
Linux hoge 5.10.0-19-amd64 #1 SMP Debian 5.10.149-2 (2022-10-21) x86_64 GNU/Linux
Rのインストール
sudo apt install r-base
データの作成
表計算ソフトで表を作って、csvでダウンロードまたはエクスポート。
例では r-test.csvとして保存。
Rの起動
$ R(大文字)
データの読み込み
> dat <- read.csv("r-test.csv") > attach(dat) # こうすると、data = dat が省略できる
クリップボードを介した方法については、わかったら追記するかも…(^^ゞ
分散分析
> anova(lm(Value~Method, data = dat)) Analysis of Variance Table Response: Value Df Sum Sq Mean Sq F value Pr(>F) Method 2 112.889 56.444 72.571 6.256e-05 *** Residuals 6 4.667 0.778 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Tukey多重検定
> amod <- aov(Value~Method, data = dat) > TukeyHSD(amod) Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = Value ~ Method) $Method diff lwr upr p adj M2-M1 4.666667 2.457257 6.876077 0.0015596 M3-M1 8.666667 6.457257 10.876077 0.0000493 M3-M2 4.000000 1.790590 6.209410 0.0034732
padjが0.05(5%水準)未満ならばMethod間に差がある。
Rを使うと、ものすごく簡単に統計処理ができちゃうんだね。びっくり。
また、必要に迫られたら追記するかも…