Non c’è niente di strano nell’Odds Ratio: Interpretazione della regressione logistica binaria
La regressione logistica binaria potrebbe non essere la forma più comune di regressione, ma quando viene utilizzata tende a causare molte più un mal di testa del necessario. Le regressioni logistiche binarie sono molto simili alle loro controparti lineari in termini di utilizzo e interpretazione, e l’unica vera differenza qui è nel tipo di variabile dipendente che usano. In una regressione lineare, la variabile dipendente (o ciò che si sta tentando di prevedere) è continua. In una regressione logistica binaria, la variabile dipendente è binaria, il che significa che la variabile può avere solo due valori possibili. Per questo motivo, quando si interpreta la regressione logistica binaria, non stiamo più parlando di come le nostre variabili indipendenti prevedono un punteggio, ma di come prevedono in quale dei due gruppi di variabili dipendenti binarie cadono le persone. Per fare ciò, esaminiamo l’odds ratio.
Considera una regressione logistica binaria condotta da un ricercatore che ha recentemente guardato il film Lo squalo ed è terrorizzato di affrontare la stessa sorte di alcuni dei personaggi meno fortunati in questo film. Sceglie alcune variabili predittive per valutare le sue possibilità di essere mangiata da un gigantesco squalo bianco mangiatore di uomini, in base a (a) punteggio della Shark Related Deliciousness Scale (SRDS) e (b) il suo sesso. Poiché deve definire queste variabili in modo da poterle interpretare in seguito, identifica la scala SRDS come compresa tra 1 e 5; questo è continuo. Il genere è binario, proprio come il risultato, e lo ricodifica come 0 = femmina e 1 = maschio.
Inizia raccogliendo alcuni dati su tutti coloro che erano stati mangiati da un gigante mangiatore di uomini squalo bianco in passato. Dopo aver raccolto i dati ed eseguito l’analisi su queste variabili per determinare la loro relazione con l’incontro con una prematura scomparsa di questa enorme creatura marina, scopre che la regressione stessa è significativa. L’analisi produce l’output nella tabella seguente. e calcola i seguenti risultati. In genere, un’analisi di regressione logistica binaria fornisce un output maggiore di questo, ma oggi ci concentreremo sull’odds ratio.
Predictor |
valore p |
Odds ratio |
Sesso | ||
Punteggio SDRS |
Come spiegato sopra, uno di questi predittori è binario e l’altro è continuo. Ciò significa che dobbiamo interpretare i due in modo leggermente diverso. Il primo è il punteggio binario: sesso. Per prima cosa guardiamo il valore p. È inferiore a 0,05, il che ci dice che è significativo e che possiamo interpretare con sicurezza l’odds ratio. Per interpretare questo risultato, dobbiamo sapere a cosa corrispondono uno 0 (basso) e un 1 (alto) e la nostra ricercatrice ricorda di averlo codificato come 0 = femmina e 1 = maschio. Trova che questa sia una buona cosa perché quando l’odds ratio è maggiore di 1, descrive una relazione positiva. La relazione positiva significa che all’aumentare del sesso, aumentano le probabilità di essere mangiati. In base alla nostra codifica, un “aumento” di genere significa un sesso di 1 invece di 0, in altre parole, essere maschio. Questo può essere interpretato nel senso che essere nel gruppo (1), o essere maschio, ti mette a 5 volte maggiori probabilità di essere mangiato.
Se l’odds ratio per il sesso fosse stato inferiore a 1, lo avrebbe fatto hanno avuto problemi, poiché un odds ratio inferiore a 1 implica una relazione negativa. Ciò significa che essere maschio corrisponderebbe a minori probabilità di essere mangiato. Per mettere questo in prospettiva, se avesse codificato maschio come 0 e femmina come 1, lo stesso odds ratio sarebbe stato invertito a 0,2, o (1/5). Ciò significa ancora che le femmine avevano minori probabilità di essere mangiate, poiché l’odds ratio sarebbe stato inferiore a 1.
Il prossimo è il risultato della nostra fittizia scala di prelibatezza. Ha un valore p di 0,001, che è inferiore al valore limite standard di 0,05, quindi questa variabile è significativa. Poiché questa variabile è continua, l’interpretazione dell’odds ratio è leggermente diversa, ma possiamo usare la stessa logica. Questo odds ratio è interpretato in termini di aumento di ogni unità sulla scala (cioè, passando da 1 a 2, da 2 a 3, ecc.). Pertanto, per ogni aumento del punteggio di prelibatezza, le probabilità di essere mangiato da una mostruosità simile a Jaws aumentano di un fattore 2. Ciò significa che qualcuno con un punteggio di 2 sulla bilancia ha 2 volte più probabilità di essere mangiato rispetto a qualcuno con un punteggio di 1. Allo stesso modo, le probabilità di qualcuno con un punteggio di 1 sono invertite da lì (1/2), o .5, per descrivere quanto meno è probabile che vengano mangiate rispetto a qualcuno con un punteggio di 2. Tutti di questi sono in relazione a qualcuno con un punteggio adiacente (cioè 1 contro 2, 2 contro3 e così via). Ma per confrontare qualcuno con un punteggio di 2 con qualcuno con un 5, le cose iniziano a sommarsi …
Con una prelibatezza di 2, le probabilità sono 2 volte più probabili di 1; a 3, le probabilità sono 4 volte più probabili di 1 (poiché sono 2 volte più probabili di una prelibatezza di 2, che è 2 volte più probabile di un punteggio di 1). Seguendo questa logica, saltando avanti di più di un punto alla volta, si utilizza la seguente equazione: (Odds Ratio ^ differenza numero di intervalli) = differenza di odds. Quindi, per qualcuno con un punteggio di 5 (4 intervalli da un punteggio di 1), le probabilità di essere mangiato sono (2 ^ 4) 16 volte maggiori di qualcuno con un punteggio di 1.
Per concludere , la cosa importante da ricordare sull’odds ratio è che un odds ratio maggiore di 1 è un’associazione positiva (cioè, un numero più alto per il predittore indica il gruppo 1 nel risultato) e un odds ratio minore di 1 è un’associazione negativa (cioè , un numero più alto per il predittore indica il gruppo 0 nel risultato).