●2回目(点推定:一致性・不変分散)・・・標本の値を使って、母集団を求める
標本平均:X =X1+X2・・・+Xnn
不変分散:U2=(X1−X)2+(X2−X)2・・・+(Xn−X)2n−1
推定量に臨む性質
・一致性:nが大きくなれば母数(真の値)が推定量に限りなく近づく
・普遍性:推定量の期待値(真の値)が母数になる
Q:なぜ標本分散ではなく不変分散を使うのか?
A:標本分散では真の分散を過小評価してしまうから
●3回目(区間推定:分散が既知な場合)
1個の標本で母平均を区間推定する
標本:μ=165
分散:σ2=62
信頼度95%の信頼区間
X-1.96σ<μ<X+1.96σ
165-1.96*6<μ<165+1.69*6
算出される信頼区間のうち95%が母平均を含む
複数個の標本から母平均を区間推定する
標本集合
X1、X2、X3・・・Xn
標本平均をつくる
Xは平均μ、分散σ2nの正規分布に従う
X−1.96σ√n<μ<X+1.96σ√n
●4回目 区間推定:母分散が未知な場合
(母分散が未知のため、標本からわかるの不変分散で代用)
Z=X−μσ√n
標準正規分布に従う
平均μ、分散σ2の正規分布に従う独立な確率変数X1、X2、・・・Xnがあるとする、このとき
T=X−μU√nは自由度n-1のt分布に従う
t分布の特徴
・左右対称
・正規分布をつぶした形
・nが大きくなると正規分布に従う
母集団
μ=?
σ2=?
標本(94,99、86、101)
n=4
X=95
u2=(94−95)2・・・+(101−95)24−1=44.67・・・不変分散
u=6.68
95−3.186.68√2<μ<95+3.186.68√2
84.4≦μ≦105.6
●5回目 区間推定:母集団分布が未知な場合
・標本をたくさん集める
・不変分散で代用する
X−1.96σ√n<μ<X+1.96σ√n
ここでnが十分大きいので、σをU(不変分散からもとまる標準偏差)でそのまま置き換えて
X−1.96U√n≦μ≦X+1.96U√nを信頼区間95%の信頼区間とする
●6回目 母比率の推定
母比率:p
標本比率:R
母比率の95%信頼区間を求める
角Xiはベルヌーイ分布に従う(平均:p、分散:p(1-p))
→nが十分大きいとき、中心極限定理より
X=(X1+X2+・・・・+Xn)/n=R
は平均p、分散p(1-p)/nの正規分布に従う
R−1.96√p(1−p)n<p<R+1.96√p(1−p)n
ここで、nが十分大きいから
√p(1−p)nを√R(1−R)nに置き換えて、
R−1.96√R(1−R)n<p<R+1.96√R(1−R)n
ex.ヨビノリの認知率を調べるために、無作為に選んだ理系大学生400人に「このチャンネルを知っているか」と聞いたところ、320人が「知っている」と答えた。全国の理系大学生への認知率pを信頼度95%で推定せよ。
0.8−1.96√0.8(0.2)400≦p≦0.8+1.96√0.8(0.2)400
0.7608≦p≦0.8392
●7回目 母分散の推定
母集合:μ=?、σ2=?、正規分布
標本集合:
T=(n−1)U2σ2
は自由度n-1のχ2分布に従う
・左右非対称
・自由度によって形状が大きく変わる
——ex.おかし——
母集合
μ=?
σ2=?
標本集合
n=10
X=9.90
U2=0.25
自由度9のχ2分布
下側2.5%点:2.7
上側2.5%点19.0
(n−1)U219.0<σ2<(n−1)U22.70
0.118<σ2<0.833
————
●8回目 母平均の検定
——ex.——
あるメーカーが「この製品の内容量は150mLです」と主張している。しかし最近この量が減ったのではないかと疑っている。そこで、この製品100個を無作為に抽出して調べてみたところ、その平均は148.5mlであった。このことから「平均内容量は減った」といえるか。内容量の分布は母分散8.02の正規分布とし、優位水準5%で検定せよ。
平均:150
分散:8.02/100(8/10)
棄却域(5%点):148.7
●検定の流れ
- 帰無仮説H0と対立仮説H1を設定。
- H0のもとで対象となる統計量の分布を調べる
- 有意水準(危険率)を決め、2の分布においてH1に有利となる棄却域を設定
- 標本を抽出し、統計量が棄却域にあるかを調べ、棄却域にあればH0を棄却する
●9回目 ウェルチの検定
T=(Xa−Xb)√(1Xa+1Xb)(na−1)Ua2+(nb−1)Ub2na+nb−2を
は自由度na+nb-2のt分布に従う。