Das Quotenverhältnis ist nicht seltsam: Interpretation der binären logistischen Regression
Die binäre logistische Regression ist möglicherweise nicht die häufigste Form der Regression, aber wenn sie verwendet wird, verursacht sie tendenziell viel mehr Kopfschmerzen als nötig. Binäre logistische Regressionen sind ihren linearen Gegenstücken in Bezug auf Verwendung und Interpretation sehr ähnlich, und der einzige wirkliche Unterschied besteht hier in der Art der von ihnen verwendeten abhängigen Variablen. In einer linearen Regression ist die abhängige Variable (oder was Sie vorhersagen möchten) kontinuierlich. In einer binären logistischen Regression ist die abhängige Variable binär, was bedeutet, dass die Variable nur zwei mögliche Werte haben kann. Aus diesem Grund sprechen wir bei der Interpretation der binären logistischen Regression nicht mehr darüber, wie unsere unabhängigen Variablen eine Punktzahl vorhersagen, sondern wie sie vorhersagen, in welche der beiden Gruppen der binär abhängigen Variablen Menschen fallen. Dazu betrachten wir das Odds Ratio.
Betrachten Sie eine binäre logistische Regression, die von einem Forscher durchgeführt wurde, der kürzlich den Film Jaws gesehen hat und Angst hat, dem gleichen Schicksal wie einige der weniger glücklichen Charaktere zu begegnen Film. Sie wählt einige Prädiktorvariablen aus, um ihre Chancen zu bewerten, von einem riesigen menschenfressenden Weißen Hai gefressen zu werden, basierend auf (a) Punktzahl auf der Shark Related Deliciousness Scale (SRDS) und (b) ihrem Geschlecht. Da sie diese Variablen definieren muss, damit sie sie später interpretieren kann, identifiziert sie die SRDS-Skala als zwischen 1 und 5 liegend. das ist kontinuierlich. Das Geschlecht ist binär, genau wie das Ergebnis, und sie kodiert es als 0 = weiblich und 1 = männlich.
Sie beginnt damit, einige Daten über all diejenigen zu sammeln, die von einem riesigen Mann gegessen wurden, der großartig isst weißer Hai in der Vergangenheit. Nachdem sie die Daten gesammelt und die Analyse dieser Variablen durchgeführt hat, um festzustellen, in welchem Verhältnis sie zu einem vorzeitigen Tod dieses riesigen Meerestiers stehen, stellt sie fest, dass die Regression selbst signifikant ist. Die Analyse ergibt die Ausgabe in der folgenden Tabelle. und berechnet die folgenden Ergebnisse. Normalerweise liefert eine binäre logistische Regressionsanalyse mehr Ergebnisse als diese, aber heute konzentrieren wir uns auf das Quotenverhältnis.
Prädiktor |
p-Wert |
Quotenverhältnis |
Geschlecht | ||
SDRS-Score |
Wie oben erläutert, ist einer dieser Prädiktoren binär und der andere kontinuierlich. Das heißt, wir müssen die beiden etwas unterschiedlich interpretieren. Erstens ist die binäre Punktzahl: Geschlecht. Wir betrachten zuerst den p-Wert. Es liegt unter 0,05 und sagt uns, dass es signifikant ist, und wir können das Quotenverhältnis sicher interpretieren. Um dieses Ergebnis zu interpretieren, müssen wir wissen, was eine 0 (niedrig) und eine 1 (hoch) entsprechen, und unsere Forscherin erinnert sich, dass sie dies als 0 = weiblich und 1 = männlich codiert hat. Sie findet das gut, denn wenn das Odds Ratio größer als 1 ist, beschreibt es eine positive Beziehung. Die positive Beziehung bedeutet, dass mit zunehmendem Geschlecht die Wahrscheinlichkeit steigt, gegessen zu werden. Basierend auf unserer Kodierung bedeutet eine Zunahme des Geschlechts ein Geschlecht von 1 statt 0 – mit anderen Worten, männlich zu sein. Dies kann so interpretiert werden, dass Sie in der (1) Gruppe oder als Mann eine 5-mal höhere Wahrscheinlichkeit haben, gegessen zu werden.
Wenn das Quotenverhältnis für das Geschlecht unter 1 gelegen hätte, würde sie dies tun waren in Schwierigkeiten, da ein Odds Ratio von weniger als 1 eine negative Beziehung impliziert. Dies bedeutet, dass Männlichkeit mit einer geringeren Wahrscheinlichkeit, gegessen zu werden, korrespondiert. Um dies ins rechte Licht zu rücken: Wenn sie männlich als 0 und weiblich als 1 codiert hätte, wäre das gleiche Quotenverhältnis auf 0,2 oder (1/5) invertiert worden. Dies bedeutet immer noch, dass Frauen eine geringere Wahrscheinlichkeit hatten, gegessen zu werden, da das Quotenverhältnis unter 1 gelegen hätte.
Als nächstes folgt das Ergebnis unserer fiktiven Köstlichkeitsskala. Es hat einen p-Wert von 0,001, der niedriger als der Standard-Grenzwert von 0,05 ist, daher ist diese Variable von Bedeutung. Da diese Variable stetig ist, ist die Interpretation des Odds Ratio etwas anders, aber wir können dieselbe Logik verwenden. Dieses Quotenverhältnis wird als Erhöhung jeder Einheit auf der Skala interpretiert (d. H. Von 1 auf 2, 2 auf 3 usw.). Mit jeder Erhöhung der Köstlichkeitsbewertung erhöht sich die Wahrscheinlichkeit, von einer Jaws-ähnlichen Monstrosität gefressen zu werden, um den Faktor 2. Dies bedeutet, dass jemand mit einer Punktzahl von 2 auf der Skala zweimal häufiger gegessen wird als jemand mit eine Punktzahl von 1. Ebenso werden die Chancen von jemandem mit einer Punktzahl von 1 von dort (1/2) oder 0,5 invertiert, um zu beschreiben, wie viel weniger wahrscheinlich es ist, dass er gegessen wird als jemand mit einer Punktzahl von 2. Alle von diesen beziehen sich auf jemanden mit einer benachbarten Punktzahl (dh 1 gegen 2, 2 gegen3 und so weiter). Aber um jemanden mit einer Punktzahl von 2 mit jemandem mit einer 5 zu vergleichen, summieren sich die Dinge…
Bei einer Köstlichkeit von 2 sind die Chancen 2-mal wahrscheinlicher als 1; Bei 3 sind die Chancen 4-mal wahrscheinlicher als 1 (da sie 2-mal wahrscheinlicher sind als eine Köstlichkeit von 2, was 2-mal wahrscheinlicher ist als eine Punktzahl von 1). Wenn Sie dieser Logik folgen und mehr als einen Punkt gleichzeitig überspringen, verwenden Sie die folgende Gleichung: (Odds Ratio ^ Anzahl der Intervalldifferenzen) = Differenz der Quoten. Für jemanden mit einer Punktzahl von 5 (4 Intervalle von einer Punktzahl von 1) ist die Wahrscheinlichkeit, gegessen zu werden, (2 ^ 4) 16-mal höher als für jemanden mit einer Punktzahl von 1.
Zum Schluss Das Wichtigste beim Quotenverhältnis ist, dass ein Quotenverhältnis größer als 1 eine positive Assoziation ist (dh eine höhere Zahl für den Prädiktor bedeutet Gruppe 1 im Ergebnis), und ein Quotenverhältnis kleiner als 1 ist eine negative Assoziation (dh Eine höhere Zahl für den Prädiktor bedeutet Gruppe 0 im Ergebnis.