12.4: The Central Limit Theorem
The Central Limit Theorem fortæller os, at når stikprøvestørrelser bliver større, vil prøveuddelingen af gennemsnittet blive normalfordelt, jævn hvis dataene i hver prøve ikke normalt distribueres.
Vi kan se dette i rigtige data. Lad os arbejde med variablen AlcoholYear i NHANES-distributionen, som er meget skæv, som vist i venstre panel i figur ??. Denne distribution er i mangel af et bedre ord funky – og bestemt ikke normalt distribueret. Lad os nu se på samplingfordelingen af middelværdien for denne variabel. Figur 12.2 viser prøveuddelingen for denne variabel, som opnås ved gentagne gange at trække prøver af størrelse 50 fra NHANES-datasættet og tage gennemsnittet. På trods af den klare ikke-normalitet af de originale data er samplingsfordelingen bemærkelsesværdigt tæt på det normale.
Centralgrænsesætningen er vigtig for statistikker, fordi det giver os mulighed for sikkert at antage, at prøveuddelingen af middelværdien vil i de fleste tilfælde være normal. Dette betyder, at vi kan drage fordel af statistiske teknikker, der antager en normalfordeling, som vi vil se i det næste afsnit.