それではt分布を使う例として、信頼区間のところでとった一日分のポテトの本数を使って、本数の信頼区間を出してみます。
47 51 49 50 49
46 51 48 52 49 (本)
一日目に数えたポテト この平均は 49.2 標準偏差は 1.78 でした。 分布が正規分布であれば、95%の信頼区間を決めるための値は1.96です。
しかし、標本が小さく正規分布でない場合は、
t分布表で標本数に見合う自由度を見つけ、その自由度から正規分布のときの1.96に変わる値を求めて標準偏差にかけると、95%の信頼区間を求めることができます。
〜具体的にやってみましょう〜
まず、自由度をだします。
自由度=標本数-1 なので、 自由度=10-1=9 。
自由度 t値 自由度 t値 5 6 ・ 9 ・ 27 2.015
1.943
・
1.833
・
1.703
2.571
2.447
・
2.262
・
2.052
4.032
3.707
・
2.821
・
2.771
28 29 30 ・ ・ ∞ 1.701
1.699
1.697
・
・
1.645
2.048
2.045
2.042
・
・
1.960
2.763
2.756
2.750
・
・
2.576
出現確率 0.10
0.05
0.01
出現確率 0.10
0.05
0.01
有意水準 有意傾向
5%
1%
有意水準 有意傾向
5%
1%
自由度=9 で、出現確率0.05のところを見ると、2.262なので、
平均 49.2 標準偏差 1.78
標準偏差に 2.262倍し、平均に加減算すればよいわけです。
49.2-(2.262×1.78)<95%の信頼区間<49.2+(2.262×1.78)
これを計算すると45.1736…から53.2263…となり、45本から53本の間、になります。
しかし、10日分のデータから出した95%信頼区間は、46.5804… から 53.4595… でした。
以上から、「標本が大きくなるにつれて、信頼区間は狭まり、信頼度も高まる」ということが分かりました。
分かったら応用問題