それでは各平均が出揃ったところで、平均の差の検定方法について考えてみましょう。
まず検定の前に仮説をたてておきます。
帰無仮説
「三つのお店のポテトの評価の平均点に差はない」になります。
対立仮説
「三つのお店のポテトの評価の平均点に差がある」になります。
具体的な方法として、3つの平均を比較するときは、各データが全体の平均とどれくらいズレがあるかを調べます。
詳しく言うと、そのデータのズレが、全体の平均の差とその条件の差によってできたズレなのか、店のデータをとってくる時点でおきた(あるいは偶然による)ズレなのか、のどちらによるものなのかを調べるということです。
それでは、図を使って詳しく説明しましょう。
今、平均値を比べたい、いくつかの条件があります。(その条件の一つをA条件とします。)
調べたい条件のすべての平均(全体の平均)を求めます。
次に、A条件の中の一つのデータをとってきます。
そこで、とってきたあるデータと、全体の平均とのズレに注目してみます。
この全体平均からのズレを分解して考えると、下の図のように、全体平均からのズレは平均の差によって生じたズレと偶然の差によるズレの2種類のズレによってできているのが分かります。
これを、すべての条件のデータ一つ一つについてみましょう。
そして、各ズレからは、次の式ができます。
これで、
が大きければ、
は
の影響を受けたことになり、偶然の差でなかったことが言えます。
このとき各データのズレは、二乗しなければなりません。差を二乗することによって、値の+、−を消す必要があるからです。
これが分散分析です。
計算する