12.4: The Central Limit Theorem (Svenska)
Central Limit Theorem säger att när provstorlekar blir större kommer samplingsfördelningen av medelvärdet att bli normalfördelad, jämn om data i varje prov inte normalt distribueras.
Vi kan se detta i verkliga data. Låt oss arbeta med variabeln AlcoholYear i NHANES-distributionen, som är mycket sned, som visas i den vänstra panelen i figur ??. Denna distribution är, i avsaknad av ett bättre ord, funky – och definitivt inte normalt distribuerad. Låt oss nu titta på samplingsfördelningen av medelvärdet för denna variabel. Figur 12.2 visar samplingsfördelningen för denna variabel, vilken erhålls genom att upprepade gånger rita prover av storlek 50 från NHANES-datasetet och ta medelvärdet. Trots den tydliga icke-normaliteten hos originaldata är samplingsfördelningen anmärkningsvärt nära det normala.
Centralgränssatsen är viktig för statistik eftersom det gör att vi säkert kan anta att provtagningsfördelningen av medelvärdet är normalt i de flesta fall. Detta innebär att vi kan dra nytta av statistiska tekniker som antar en normalfördelning, vilket vi kommer att se i nästa avsnitt.