●2回目(点推定:一致性・不変分散)・・・標本の値を使って、母集団を求める

標本平均:X =X1+X2Xn
不変分散:U=X1X+X2XXnX1

推定量に臨む性質
・一致性:nが大きくなれば母数(真の値)が推定量に限りなく近づく
・普遍性:推定量の期待値(真の値)が母数になる

Q:なぜ標本分散ではなく不変分散を使うのか?
A:標本分散では真の分散を過小評価してしまうから

●3回目(区間推定:分散が既知な場合)

1個の標本で母平均を区間推定する

標本:μ=165
分散:σ2=62

 

信頼度95%の信頼区間

X-1.96σ<μ<X+1.96σ

165-1.96*6<μ<165+1.69*6

算出される信頼区間のうち95%が母平均を含む

 

複数個の標本から母平均を区間推定する

標本集合
X1、X2、X3・・・Xn
標本平均をつくる
Xは平均μ、分散σ2の正規分布に従う

X1.96σμX+1.96σ

●4回目 区間推定:母分散が未知な場合
(母分散が未知のため、標本からわかるの不変分散で代用)

ZXμσ

標準正規分布に従う

 

定理

平均μ、分散σ2の正規分布に従う独立な確率変数X1、X2、・・・Xnがあるとする、このとき

TXμUは自由度n-1のt分布に従う

 

t分布の特徴
・左右対称
・正規分布をつぶした形
・nが大きくなると正規分布に従う

 

母集団
μ=?
σ2=?

標本(94,99、86、101)
n=4
X=95
u2=949521019524144.67・・・不変分散

u=6.68

953.186.682μ95+3.186.682

84.4μ105.6

●5回目 区間推定:母集団分布が未知な場合

・標本をたくさん集める
・不変分散で代用する

中心極限定理
平均μ、分散σ2の母集団から抽出した標本の大きさnが十分大きいとき、標本平均Xは近似的に平均μ、分散σ2の正規分布に従う

 

X1.96σμX+1.96σ

ここでnが十分大きいので、σをU(不変分散からもとまる標準偏差)でそのまま置き換えて

X1.96μX+1.96を信頼区間95%の信頼区間とする

●6回目 母比率の推定

母比率:p
標本比率:R

母比率の95%信頼区間を求める
角Xiはベルヌーイ分布に従う(平均:p、分散:p(1-p))
→nが十分大きいとき、中心極限定理より
X=(X1+X2+・・・・+Xn)/n=R

は平均p、分散p(1-p)/nの正規分布に従う

R1.96p(1p)npR+1.96p(1p)n

ここで、nが十分大きいから

p(1p)nR(1R)nに置き換えて、

R1.96R(1R)npR+1.96R(1R)n

ex.ヨビノリの認知率を調べるために、無作為に選んだ理系大学生400人に「このチャンネルを知っているか」と聞いたところ、320人が「知っている」と答えた。全国の理系大学生への認知率pを信頼度95%で推定せよ。

0.81.960.8(0.2)400p0.8+1.960.8(0.2)400

0.7608p0.8392

●7回目 母分散の推定

母集合:μ=?、σ2=?、正規分布
標本集合:

定理
分散σ2の正規分布に従う独立な確率変数X1,X2、・・・Xnがあるとする。このとき
T(n1)U2σ2
は自由度n-1のχ2分布に従う
●特徴
・左右非対称
・自由度によって形状が大きく変わる

 

——ex.おかし——
母集合
μ=?
σ2=?

標本集合

n=10
X=9.90
U2=0.25

自由度9のχ2分布

下側2.5%点:2.7
上側2.5%点19.0

1U219.0σ2(n1)U22.70
0.118σ20.833

————

●8回目 母平均の検定
——ex.——

あるメーカーが「この製品の内容量は150mLです」と主張している。しかし最近この量が減ったのではないかと疑っている。そこで、この製品100個を無作為に抽出して調べてみたところ、その平均は148.5mlであった。このことから「平均内容量は減った」といえるか。内容量の分布は母分散8.0の正規分布とし、優位水準5%で検定せよ。

平均:150
分散:8.0/100(8/10)

棄却域(5%点):148.7

●検定の流れ

  1. 帰無仮説H0と対立仮説H1を設定。
  2. H0のもとで対象となる統計量の分布を調べる
  3. 有意水準(危険率)を決め、2の分布においてH1に有利となる棄却域を設定
  4. 標本を抽出し、統計量が棄却域にあるかを調べ、棄却域にあればH0を棄却する

●9回目 ウェルチの検定

定理

 

同じ母平均と母分散をもつ2つの正規母集団A,Bから、それぞれ大きさna,nbの標本を抽出したとする、このとき
T=(XaXb)1Xa+1Xb(na1)Ua2+(nb1)Ub2na+nb2
は自由度na+nb-2のt分布に従う。