Main Content

仮説検定の仮定

データにサンプリングされている確率変数の分布についての仮定は、仮説検定ごとに異なります。これらの仮定は、検定を選択したり、結果を解釈するときに、考えなければなりません。

たとえば、z 検定 (ztest) と t 検定 (ttest) はいずれも、データが正規分布から個別に抽出されていることを前提としています。Statistics and Machine Learning Toolbox™ には、chi2gofjbtestlillietestnormplot など、この前提を検定できる関数があります。

z 検定と t 検定は、標本のサイズ n が十分大きい限り、この仮定からのずれに関して比較的ロバストです。どちらの検定でも標本平均 x¯ を計算します。中心極限定理によると、抽出対象となる母集団の分布に関係なく、標本平均の分布は平均が母集団平均 μ に等しい正規分布とほぼ同じになります。

z 検定と t 検定の相違は、基になっている正規分布の標準偏差 σ の仮定にあります。z 検定は、σ が知られていることを仮定しますが、t 検定では仮定されません。その結果、t 検定は、標本から標準偏差の推定 s を計算しなければなりません。

z 検定と t 検定の検定統計量は、それぞれ、

z=x¯μσ/nt=x¯μs/n

母集団は平均 μ をもつ分布であるという帰無仮説の場合、z 統計量は、標準正規分布 N(0,1) をもちます。同じ帰無仮説の場合、t 統計量は、自由度 n – 1 をもつスチューデントの t 分布に従います。標本のサイズが小さい場合、スチューデントの t 分布は、推定 s の信頼性が低くなったことを補い、N (0,1) よりも平らで幅が広くなります。しかし、標本のサイズが大きくなるにつれて、スチューデントの t 分布は標準正規分布に近づき、2 つの検定は本質的に同じになります。

帰無仮説の場合、検定統計量の分布がわかると、p 値の正確な計算が可能になります。検定の仮定のコンテキストで p 値を解釈すると、検定の結果を批判的に見ることが可能になります。

Statistics and Machine Learning Toolbox の仮定検定を基礎とする仮定については、関数を実行するためのリファレンス ページを参照してください。

関連するトピック