分散分析の概要と、1元配置分散分析については以下で説明をしました。
わかりやすい分散分析
ここでは要因が2つになった二元配置分散分析について学んでいこうと思います。
先に結論を話すと、一元配置分散分析と実はほとんど計算方法は変わらないです。
なので、いきなりですが具体的な計算をしてみようと思います!
具体的に計算をしてみます
以下のようなデータを考えてみます!
作業人(要因A)、機械(要因B) | \(B_{1}\) | \(B_{2}\) | \(Aの平均\) |
---|---|---|---|
\(A_{1}\) | 16,18,19,19,18 | 12,10,7,12,14 | 14.5 |
\(A_{2}\) | 18,19,19,20,21 | 17,19,21,19,20 | 19.3 |
\(A_{3}\) | 18,18,19,18,16 | 27,27,31,30,29 | 23.3 |
\(Bの平均\) | 18.4 | 19.67 | 19.03(総平均) |
作業人3人が、2種類の機械を用いて作業をして製造した個数を表してます。
求め方や考え方は、例え要因が2つ、つまり二元配置分散分析になったとしても一元配置分散分析の計算方法は違わないので、同じように計算してみます。
要因変動\(S_{B}\)
今回要因はA、Bの2つありますので、それぞれで計算してみます。
▼ まず要因Aの要因変動
要因Aの要因変動を求めるので、要因Aの各水準の平均の値に書き換えます。
作業人(要因A)、機械(要因B) | \(B_{1}\) | \(B_{2}\) | \(Aの平均\) |
---|---|---|---|
\(A_{1}\) | 14.5,14.5,14.5,14.5,14.5 | 14.5,14.5,14.5,14.5,14.5 | 14.5 |
\(A_{2}\) | 19.3,19.3,19.3,19.3,19.3 | 19.3,19.3,19.3,19.3,19.3 | 19.3 |
\(A_{3}\) | 23.3,23.3,23.3,23.3,23.3 | 23.3,23.3,23.3,23.3,23.3 | 23.3 |
\(Bの平均\) | 18.4 | 19.67 | 19.03(総平均) |
それぞれのデータと総平均を引いた値の2乗の合計を求めます!
水準1のデータ、40.33について、(40.33-47.77)\(^{2}\)を1つずつ計算して合計したものが、要因変動です。
つまり、水準1では40.33が9つ、水準2では7つ、水準3は7つ、水準4は8つなので、
\begin{eqnarray}
\begin{split}
S_{B}
&= \quad 10(14.5-19.03)^{2} 205.209 \\
&\quad+ 10(19.3-19.03)^{2} 0.729 \\
&\quad+ 10(23.3-19.03)^{2} 182.329 \\
&= 388.267
\end{split}
\end{eqnarray}
となります。
自由度は、水準が3つなので、3-1=2です。
▼ まず要因Bの要因変動
要因Bの要因変動を求めるので、要因Bの各水準の平均の値に書き換えます。
作業人(要因A)、機械(要因B) | \(B_{1}\) | \(B_{2}\) | \(Aの平均\) |
---|---|---|---|
\(A_{1}\) | 18.4,18.4,18.4,18.4,18.4 | 19.67,19.67,19.67,19.67,19.67 | 14.5 |
\(A_{2}\) | 18.4,18.4,18.4,18.4,18.4 | 19.67,19.67,19.67,19.67,19.67 | 19.3 |
\(A_{3}\) | 18.4,18.4,18.4,18.4,18.4 | 19.67,19.67,19.67,19.67,19.67 | 23.3 |
\(Bの平均\) | 18.4 | 19.67 | 19.03(総平均) |
それぞれのデータと総平均を引いた値の2乗の合計を求めます!
水準1のデータ、40.33について、(40.33-47.77)\(^{2}\)を1つずつ計算して合計したものが、要因変動です。
つまり、水準1では40.33が9つ、水準2では7つ、水準3は7つ、水準4は8つなので、
\begin{eqnarray}
\begin{split}
S_{B}
&= \quad 15(18.4-19.03)^{2} 5.9535 \\
&\quad+ 15(19.67-19.03)^{2} 6.144 \\
&= 12.0975
\end{split}
\end{eqnarray}
となります。
自由度は、水準が3つなので、3-1=2です。
▼ 要因A×Bの要因変動
A×Bの要因変動はどう求めれば良いでしょうか。
ざっくり今まで、要因変動は要因Aの平均値と総平均を引いて2乗してました。
なので、要因A×Bの要因変動は、
要因A×Bの平均値と総平均を引いて2乗していきます。
(A1,B1)セルのデータの平均値は18というように以下に表を計算してまとめました。
作業人(要因A)、機械(要因B) | \(B_{1}\) | \(B_{2}\) | \(Aの平均\) |
---|---|---|---|
\(A_{1}\) | 18(水準A1,水準B1) | 11(水準A1,水準B2) | 14.5 |
\(A_{2}\) | 19.4(水準A2,水準B1) | 19.2(水準A2,水準B2) | 19.3 |
\(A_{3}\) | 17.8(水準A3,水準B1) | 28.8(水準A3,水準B2) | 23.3 |
\(Bの平均\) | 18.4 | 19.67 | 19.03(総平均) |
データの数だけその平均値で置き換えます。
作業人(要因A)、機械(要因B) | \(B_{1}\) | \(B_{2}\) | \(Aの平均\) |
---|---|---|---|
\(A_{1}\) | 18,18,18,18,18 | 11,11,11,11,11 | 14.5 |
\(A_{2}\) | 19.4,19.4,19.4,19.4,19.4 | 19.2,19.2,19.2,19.2,19.2 | 19.3 |
\(A_{3}\) | 17.8,17.8,17.8,17.8,17.8 | 28.8,28.8,28.8,28.8,28.8 | 23.3 |
\(Bの平均\) | 18.4 | 19.67 | 19.03(総平均) |
よって、あとは総平均との差分の2乗をとって、
\begin{eqnarray}
\begin{split}
S_{A×B}
&= \quad 5(18-19.03)^{2} 5.9535 \\
&\quad+ 5(11-19.03)^{2} 6.144 \\
&\quad+ 5(19.4-19.03)^{2} 6.144 \\
&\quad+ 5(19.2-19.03)^{2} 6.144 \\
&\quad+ 5(17.8-19.03)^{2} 6.144 \\
&\quad+ 5(28.8-19.03)^{2} 6.144 \\
&= 813.367
\end{split}
\end{eqnarray}
誤差変動\(S_{w}\)
誤差変動は、
各水準の平均とそのデータの差分の2乗の合計になります。
要因 | データ | 平均 |
---|---|---|
水準1 | 54, 35, 48, 56, 40, 45, 49, 36, 26 | 40.33 |
水準2 | 49, 40, 61, 66, 49, 59, 52 | 53.71 |
水準3 | 53, 45, 47, 54, 38, 41, 51 | 47.00 |
水準4 | 53, 59, 64, 37, 67, 25, 58, 50 | 51.63 |
水準1にはデータ54があり、水準1の平均は40.33なので、その差分の2乗なので、(54-40.33)\(^{2}\)
これを全てのデータで計算して合計します。
\begin{eqnarray}
\begin{split}
S_{W}
&= \quad (16-19.03)^{2} \\
&\quad+ (18-19.03)^{2} \\
&\quad+ (19-19.03)^{2} \\
&\quad+ (19-19.03)^{2} \\
&\quad+ (18-19.03)^{2} \\
&\quad+ (12-19.03)^{2} \\
&\quad+ (10-19.03)^{2} \\
&\quad+ (7-19.03)^{2} \\
&\quad+ (12-19.03)^{2} \\
&\quad+ (14-19.03)^{2} \\
&\quad+ (18-19.03)^{2} \\
&\quad+ (19-19.03)^{2} \\
&\quad+ (19-19.03)^{2} \\
&\quad+ (20-19.03)^{2} \\
&\quad+ (21-19.03)^{2} \\
&\quad+ (17-19.03)^{2} \\
&\quad+ (19-19.03)^{2} \\
&\quad+ (21-19.03)^{2} \\
&\quad+ (19-19.03)^{2} \\
&\quad+ (20-19.03)^{2} \\
&\quad+ (18-19.03)^{2} \\
&\quad+ (18-19.03)^{2} \\
&\quad+ (19-19.03)^{2} \\
&\quad+ (18-19.03)^{2} \\
&\quad+ (16-19.03)^{2} \\
&\quad+ (27-19.03)^{2} \\
&\quad+ (27-19.03)^{2} \\
&\quad+ (31-19.03)^{2} \\
&\quad+ (30-19.03)^{2} \\
&\quad+ (29-19.03)^{2} \\
&= 1862.33
\end{split}
\end{eqnarray}
自由度は、データ数が31つなので、31-4=27です。
データ数は31、そしてこの計算には各水準の平均を使っており、その水準の平均を出す際に、
例えば、水準1の平均を出す場合、1つ以外の値がわかればもとまるので、水準1についてはデータ9つで1個以外で確定するので、9-1
水準2は7-1、水準3は7-1、水準4は8-1
よって、自由度は(9-1)+(7-1)+(7-1)+(8-1) = 27
検定統計量
したがって、この後説明しますが、
検定統計量\(F\)は、
\begin{eqnarray}
F
&=& \displaystyle \frac{ \displaystyle \frac{S_{B}}{3} }{ \displaystyle \frac{S_{W}}{27} } \\
&=& 4.197 \\
\end{eqnarray}
有意水準を\(\alpha=0.05\)とした時、\(F_{0.05}(3,27) = \)であり、