ひゃまだのblog

ひゃまだ(id:hymd3a)の趣味のブログ

DebianでRを使って分散分析とTukey多重検定を必要最小限で実行する

(2022-12-08 初稿 )

先日、必要に迫られて初めてRを使って分散分析とTukey体重検定を行ったので、その時のメモ。

なお、このページには必要最低限のことしか書いてないので、気が向いたら追記するつもり。

なお、当方の環境は以下のとおり。

Linux hoge 5.10.0-19-amd64 #1 SMP Debian 5.10.149-2 (2022-10-21) x86_64 GNU/Linux

Rのインストール

sudo apt install r-base

データの作成

表計算ソフトで表を作って、csvでダウンロードまたはエクスポート。

例では r-test.csvとして保存。

id Value Method
1 2.0 M1
2 3.0 M1
3 2.0 M1
4 6.0 M2
5 7.0 M2
6 8.0 M2
7 10.0 M3
8 11.0 M3
9 12.0 M3

Rの起動

$ R(大文字)

データの読み込み

> dat <- read.csv("r-test.csv")
> attach(dat)   # こうすると、data = dat が省略できる

クリップボードを介した方法については、わかったら追記するかも…(^^ゞ

分散分析

> anova(lm(Value~Method, data = dat))
Analysis of Variance Table
Response: Value
          Df  Sum Sq Mean Sq F value    Pr(>F)    
Method     2 112.889  56.444  72.571 6.256e-05 ***
Residuals  6   4.667   0.778                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Tukey多重検定

> amod <- aov(Value~Method, data = dat)
> TukeyHSD(amod)
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = Value ~ Method)

$Method
          diff      lwr       upr     p adj
M2-M1 4.666667 2.457257  6.876077 0.0015596
M3-M1 8.666667 6.457257 10.876077 0.0000493
M3-M2 4.000000 1.790590  6.209410 0.0034732

padjが0.05(5%水準)未満ならばMethod間に差がある。

 

Rを使うと、ものすごく簡単に統計処理ができちゃうんだね。びっくり。

また、必要に迫られたら追記するかも…

関連ページ