No hay nada extraño en la razón de probabilidades: interpretación de la regresión logística binaria
La regresión logística binaria puede no ser la forma más común de regresión, pero cuando se usa, tiende a causar mucho más un dolor de cabeza de lo necesario. Las regresiones logísticas binarias son muy similares a sus contrapartes lineales en términos de uso e interpretación, y la única diferencia real aquí está en el tipo de variable dependiente que utilizan. En una regresión lineal, la variable dependiente (o lo que está tratando de predecir) es continua. En una regresión logística binaria, la variable dependiente es binaria, lo que significa que la variable solo puede tener dos valores posibles. Debido a esto, al interpretar la regresión logística binaria, ya no estamos hablando de cómo nuestras variables independientes predicen una puntuación, sino de cómo predicen en cuál de los dos grupos de la variable dependiente binaria terminan cayendo las personas. Para hacer esto, miramos la proporción de probabilidades.
Considere una regresión logística binaria realizada por un investigador que recientemente vio la película Tiburón y está aterrorizado de enfrentar el mismo destino que algunos de los personajes menos afortunados en ese película. Ella elige algunas variables predictoras para evaluar sus posibilidades de ser devorada por un gran tiburón blanco gigante devorador de hombres, basándose en (a) la puntuación en la Escala de Delicias Relacionadas con Tiburones (SRDS) y (b) su género. Debido a que tiene que definir estas variables para poder interpretarlas más tarde, identifica la escala SRDS en un rango de 1 a 5; esto es continuo. El género es binario, al igual que el resultado, y lo recodifica como 0 = femenino y 1 = masculino.
Comienza por recopilar algunos datos sobre todos aquellos que habían sido devorados por un gigante devorador de hombres. tiburón blanco en el pasado. Después de recopilar los datos y ejecutar el análisis de estas variables para determinar su relación con la desaparición prematura de esta enorme criatura marina, encuentra que la regresión en sí es significativa. El análisis produce el resultado en la siguiente tabla. y calcula los siguientes resultados. Normalmente, un análisis de regresión logística binaria le daría más resultados que este, pero hoy nos centraremos en la proporción de probabilidades.
Predictor |
valor p |
Razón de probabilidades |
Sexo | ||
Puntaje SDRS |
Como vimos anteriormente, uno de estos predictores es binario y el otro es continuo. Esto significa que tenemos que interpretar los dos de manera un poco diferente. Primero está la puntuación binaria: género. Primero miramos el valor p. Está por debajo de .05, lo que nos indica que es significativo y que podemos interpretar con seguridad la razón de probabilidades. Para interpretar este resultado, tenemos que saber a qué corresponden un 0 (bajo) y un 1 (alto), y nuestra investigadora recuerda que lo codificó como 0 = femenino y 1 = masculino. Ella encuentra que esto es algo bueno porque cuando la razón de probabilidades es mayor que 1, describe una relación positiva. La relación positiva significa que a medida que el género «aumenta», aumentan las probabilidades de ser comido. Según nuestra codificación, un «aumento» en el género significa un género de 1 en lugar de 0, en otras palabras, ser hombre. Esto se puede interpretar en el sentido de que estar en el grupo (1), o ser hombre, te pone en 5 veces más probabilidades de ser comido.
Si la razón de posibilidades para el sexo hubiera sido inferior a 1, ella han tenido problemas, ya que una razón de posibilidades inferior a 1 implica una relación negativa. Esto significa que ser hombre se correspondería con menores probabilidades de ser comido. Para poner esto en perspectiva, si hubiera codificado hombre como 0 y mujer como 1, la misma razón de probabilidades se habría invertido a 0,2 o (1/5). Esto aún significa que las hembras tenían menos probabilidades de ser devoradas, ya que la razón de probabilidades habría sido menor a 1.
El siguiente es el resultado de nuestra escala ficticia de delicias. Tiene un valor de p de .001, que es más bajo que el límite estándar de .05, por lo que esta variable es significativa. Debido a que esta variable es continua, la interpretación de la razón de probabilidades es un poco diferente, pero podemos usar la misma lógica. Esta razón de probabilidades se interpreta en términos de cada unidad de aumento en la escala (es decir, pasando de 1 a 2, 2 a 3, etc.). Por lo tanto, por cada aumento en la puntuación de delicias, las probabilidades de ser devorado por una monstruosidad similar a Tiburón aumentan en un factor de 2. Esto significa que alguien con una puntuación de 2 en la escala tiene 2 veces más probabilidades de ser comido que alguien con una puntuación de 1. Del mismo modo, las probabilidades de alguien con una puntuación de 1 se invierten a partir de ahí (1/2), o .5, para describir la probabilidad de que se coman que alguien con una puntuación de 2. Todas de estos están en relación con alguien con una puntuación adyacente (es decir, 1 contra 2, 2 contra3, y así sucesivamente). Pero para comparar a alguien con una puntuación de 2 con alguien con un 5, las cosas empiezan a sumar …
Con una delicia de 2, las probabilidades son 2 veces más probables que 1; en 3, las probabilidades son 4 veces más probables que 1 (ya que son 2 veces más probables que una delicia de 2, que es 2 veces más probable que una puntuación de 1). Siguiendo esta lógica, saltando más de un punto a la vez, utiliza la siguiente ecuación: (Razón de probabilidades ^ diferencia en el número de intervalos) = diferencia en las probabilidades. Entonces, para alguien con una puntuación de 5 (4 intervalos de una puntuación de 1), sus probabilidades de ser comido son (2 ^ 4) 16 veces mayores que alguien con una puntuación de 1.
Para concluir , lo importante que hay que recordar acerca de la razón de probabilidades es que una razón de probabilidades mayor que 1 es una asociación positiva (es decir, un número más alto para el predictor significa grupo 1 en el resultado), y una razón de probabilidades menor que 1 es una asociación negativa (es decir, , un número más alto para el predictor significa grupo 0 en el resultado).