仮説検定
仮説検定は、標本からの統計上の証拠に基づき、母集団についての推定を引き出す一般的な方法です。
たとえば、マサチューセッツ州のある時点でのレギュラー無鉛ガソリン 1 ガロンの価格が、平均で 1.15 ドルであるという主張があるとします。この主張が正しいかどうかはどのように決めたら良いでしょうか。この州のすべてのガソリン スタンドがその時点で、いくらの価格を付けたのか調べることができたとします。これは決定的なアプローチですが、時間を浪費し、コストがかかり、不可能とさえ思えます。
より簡単なアプローチは、無作為に選んだ少数のガソリン スタンドでガソリンの価格を調べ、その平均価格を計算することです。
標本平均は、選択の過程での偶然のばらつきにより、相互に異なります。現在の標本平均が 1.18 ドルだったとします。この 3 セントの違いは、無作為に抽出したために不自然な結果になったのでしょうか。またはガソリン 1 ガロンの平均価格が実際に 1.15 ドルよりも高いという有効な証拠でしょうか。仮説検定は、そのような判断をするための統計的方法です。
この例では、仮説検定を使用して時期の異なる 2 か月間にマサチューセッツ州全体で測定されたガソリン価格を解析します。
この例は、ファイル gas.mat
のガソリンの価格を使用します。このファイルには、1993 年のマサチューセッツ州付近におけるガソリン 1 ガロンの価格について、2 つの無作為標本が含まれています。1 つ目の標本 price1
には、1 月のある日における州内各地のランダムな観測値 20 個が含まれています。2 つ目の標本 price2
には、1 か月後の州内各地のランダムな観測値 20 個が含まれています。
load gas
prices = [price1 price2];
最初のステップとして、標本が正規分布からのものであるという仮定を検定するのが良いでしょう。正規確率プロットによって、概要がわかります。
normplot(prices)
両方の散らばりは、標本の 1 番目と 3 番目の四分位を通る直線に近似的に従います。これは、近似的に正規分布であることを示します。2 月の標本 (右側のライン) は、裾の方で正規性から少しずれていることを示します。1 月から 2 月までの平均の移動は明らかです。仮説検定は、正規性の検定を定量化するために使用されます。各標本は比較的小さいので、Lilliefors 検定が推奨されます。
lillietest(price1)
ans = 0
lillietest(price2)
ans = 0
lillietest
の既定の有意水準は 5% です。各検定によって返される logical 0 は、標本が正規分布に従っているという帰無仮説を棄却できなかったことを示します。棄却できなかったことは、母集団の正規性を反映するかもしれません。あるいは、標本のサイズが小さいことが原因で、帰無仮説に対して、説得力のある証拠がないことを反映するかもしれません。
ここで、標本平均を計算します。
sample_means = mean(prices)
sample_means = 1×2
115.1500 118.5000
1 月の標本の日において州各地の平均価格が $1.15 であったという帰無仮説を検定すると良いでしょう。州の各地で価格の標準偏差が、それまでは常に $0.04 であったということを知っている場合は、z 検定が適しています。
[h,pvalue,ci] = ztest(price1/100,1.15,0.04)
h = 0
pvalue = 0.8668
ci = 2×1
1.1340
1.1690
論理値の出力 h
= 0 は、既定の有意水準 5% では、帰無仮説が棄却されなかったことを示します。これは、帰無仮説の場合は p 値により示される、極端な値として、または標本から計算された z 統計量よりも極端な値として値を観測する確率が高いことの結果です。平均 [1.1340 1.1690] の 95% 信頼区間は、仮定された母集団平均 $1.15 を含みます。
後者の標本は、2 月の州規模の平均価格が $1.15 であるという帰無仮説を棄却する説得力のある証拠を提供するでしょうか 。確率プロットと計算された標本平均の差に示されるずれがこれを示します。このずれは、それまでの標準偏差を使う妥当性について、疑問を投げかけ、需要における有意なばらつきを示す可能性があります。既知の標準偏差が仮定できない場合は、t 検定が適しています。
[h,pvalue,ci] = ttest(price2/100,1.15)
h = 1
pvalue = 4.9517e-04
ci = 2×1
1.1675
1.2025
論理値の出力 h
= 1 は、既定の有意水準 5% での帰無仮説の棄却を示します。この場合、平均の 95% 信頼区間は、仮定された母集団平均 $1.15 を含みません。
価格の推移をもう少し詳しく調べるといいでしょう。関数 ttest2
は、2 つの独立した標本が、同じ平均と同じ標準偏差 (未知) をもつ、正規分布からのものであるかどうかを、平均が異なるという対立仮説に対して検定します。
[h,sig,ci] = ttest2(price1,price2)
h = 1
sig = 0.0083
ci = 2×1
-5.7845
-0.9155
帰無仮説は既定の有意水準 5% で棄却され、平均差の信頼区間には、ゼロと仮定された値が含まれません。このようなずれを可視化するもう 1 つの方法が、ノッチのある箱ひげ図です。
boxplot(prices,1) h = gca; h.XTick = [1 2]; h.XTickLabel = {'January','February'}; xlabel('Month') ylabel('Prices ($0.01)')
このプロットは、中央値の周りの標本の分布を表示します。各ボックスのノッチの高さは、中央値が既定の有意水準 5% で異なる場合、並んだボックスのノッチが重ならないように計算されます。この計算は、データが正規分布するという仮定に基づいていますが、この比較は他の分布に対してもロバストです。並んだプロットは、平均よりも中央値を比較して一種の視覚的な仮説検定を提供します。上記のプロットは、中央値が等しいという帰無仮説をかろうじて棄却するように見えます。
関数 ranksum
によって実行されるノンパラメトリックの Wilcoxon の順位和検定は、中央値が等しいかどうかの検定を定量化するために使用できます。2 つの独立な標本が、同じ中央値をもつ同じ連続分布 (必ずしも正規分布ではない) からのものであるかどうかを、中央値が異なるという対立仮説に対して検定する場合、次のようになります。
[p,h] = ranksum(price1,price2)
p = 0.0095
h = logical
1
この検定は、等しい中央値をもつという帰無仮説を既定の 5% 有意水準で棄却します。
参考
lillietest
| ttest
| ttest2
| ztest
| boxplot
| normplot