12.4: Teorema del limite centrale
Il teorema del limite centrale ci dice che man mano che le dimensioni del campione diventano più grandi, la distribuzione campionaria della media diventerà normalmente distribuita, anche se i dati all’interno di ogni campione non sono distribuiti normalmente.
Possiamo vederlo in dati reali. Lavoriamo con la variabile AlcoholYear nella distribuzione NHANES, che è molto distorta, come mostrato nel riquadro di sinistra della figura ??. Questa distribuzione è, in mancanza di una parola migliore, funky e decisamente non distribuita normalmente. Vediamo ora la distribuzione campionaria della media per questa variabile. La Figura 12.2 mostra la distribuzione del campionamento per questa variabile, ottenuta prelevando ripetutamente campioni di dimensione 50 dal dataset NHANES e prendendo la media. Nonostante la chiara non normalità dei dati originali, la distribuzione del campionamento è notevolmente vicina al normale.
Il teorema del limite centrale è importante per le statistiche perché ci permette di presumere con sicurezza che la distribuzione campionaria della media sarà normale nella maggior parte dei casi. Ciò significa che possiamo trarre vantaggio da tecniche statistiche che assumono una distribuzione normale, come vedremo nella prossima sezione.