12.4 : The Central Limit Theorem
중앙 한계 정리는 표본 크기가 커질수록 평균의 표본 분포가 정규 분포를 따르게 될 것이라고 말합니다. 각 샘플 내의 데이터가 정규 분포를 따르지 않는 경우
실제 데이터에서 확인할 수 있습니다. 그림 ??의 왼쪽 패널에 표시된 것처럼 NHANES 분포의 변수 AlcoholYear로 작업 해 보겠습니다. 이 분포는 더 나은 단어가 없기 때문에 펑키하고 확실히 정규 분포가 아닙니다. 이제이 변수에 대한 평균의 표본 분포를 살펴 보겠습니다. 그림 12.2는 NHANES 데이터 세트에서 크기 50의 샘플을 반복적으로 추출하고 평균을 취하여 얻은이 변수에 대한 샘플링 분포를 보여줍니다. 원래 데이터의 명확한 비정규성에도 불구하고 샘플링 분포는 정규 분포에 매우 가깝습니다.
중앙 한계 정리는 통계에 중요합니다. 평균의 샘플링 분포는 대부분의 경우 정규 분포를 따릅니다. 이는 다음 섹션에서 볼 수 있듯이 정규 분포를 가정하는 통계 기법을 활용할 수 있음을 의미합니다.