12.4: Der zentrale Grenzwertsatz
Der zentrale Grenzwertsatz besagt, dass die Stichprobenverteilung des Mittelwerts mit zunehmender Stichprobengröße gleichmäßig verteilt wird Wenn die Daten in jeder Stichprobe nicht normal verteilt sind.
Wir können dies in realen Daten sehen. Lassen Sie uns mit der Variablen AlcoholYear in der NHANES-Verteilung arbeiten, die stark verzerrt ist, wie im linken Bereich von Abbildung gezeigt. Diese Distribution ist mangels eines besseren Wortes funky – und definitiv nicht normal verteilt. Betrachten wir nun die Stichprobenverteilung des Mittelwerts für diese Variable. Abbildung 12.2 zeigt die Stichprobenverteilung für diese Variable, die durch wiederholtes Ziehen von Stichproben der Größe 50 aus dem NHANES-Datensatz und Ermitteln des Mittelwerts erhalten wird. Trotz der eindeutigen Nichtnormalität der Originaldaten liegt die Stichprobenverteilung bemerkenswert nahe an der Normalverteilung.
Der zentrale Grenzwertsatz ist für die Statistik wichtig, da wir dies sicher annehmen können Die Stichprobenverteilung des Mittelwerts ist in den meisten Fällen normal. Dies bedeutet, dass wir statistische Techniken nutzen können, die eine Normalverteilung annehmen, wie wir im nächsten Abschnitt sehen werden.