12.4:中心極限定理
中心極限定理は、サンプルサイズが大きくなると、平均のサンプリング分布が正規分布になることを示しています。各サンプル内のデータが正規分布していない場合。
これは実際のデータで確認できます。図??の左側のパネルに示すように、大きく歪んでいるNHANES分布の変数AlcoholYearを使用してみましょう。この配布は、より良い言葉がないため、ファンキーであり、通常は配布されません。次に、この変数の平均のサンプリング分布を見てみましょう。図12.2は、この変数のサンプリング分布を示しています。これは、NHANESデータセットからサイズ50のサンプルを繰り返し抽出し、平均をとることによって得られます。元のデータの明らかな非正規性にもかかわらず、サンプリング分布は著しく正規分布に近いです。
中心極限定理は、次のことを安全に想定できるため、統計にとって重要です。ほとんどの場合、平均のサンプリング分布は正規分布になります。これは、次のセクションで説明するように、正規分布を想定した統計手法を利用できることを意味します。