Det finns inget udda med Odds Ratio: Tolkning av binär logistisk regression
Den binära logistiska regressionen är kanske inte den vanligaste formen av regression, men när den används tenderar den att orsaka mycket mer av huvudvärk än nödvändigt. Binära logistiska regressioner liknar mycket deras linjära motsvarigheter när det gäller användning och tolkning, och den enda verkliga skillnaden här är i vilken typ av beroende variabel de använder. I en linjär regression är den beroende variabeln (eller vad du försöker förutsäga) kontinuerlig. I en binär logistisk regression är den beroende variabeln binär, vilket innebär att variabeln endast kan ha två möjliga värden. På grund av detta talar vi inte längre om hur våra oberoende variabler förutsäger en poäng när de tolkar den binära logistiska regressionen, utan hur de förutsäger vilken av de två grupperna av de binära beroende variablerna som människor hamnar i. För att göra detta tittar vi på oddskvoten.
Tänk på en binär logistisk regression utförd av en forskare som nyligen tittade på filmen Jaws och är livrädd för att möta samma öde som några av de mindre lyckliga karaktärerna i det film. Hon väljer några prediktorvariabler för att bedöma sina chanser att bli ätna av en jätte man som äter stor vit haj, baserat på (a) poäng på Shark Related Deliciousness Scale (SRDS) och (b) hennes kön. Eftersom hon måste definiera dessa variabler så att hon kan tolka dem senare, identifierar hon SRDS-skalan som allt från 1 till 5; detta är kontinuerligt. Kön är binärt, precis som resultatet, och hon kodar om det som 0 = kvinna och 1 = man.
Hon börjar med att samla in data om alla de som hade ätits av en jätte man som äter stor vit haj tidigare. Efter att ha samlat in data och genomfört analysen av dessa variabler för att bestämma deras förhållande till att möta en alltför tidig bortgång till denna enorma havsdjur, finner hon att regressionen i sig är betydelsefull. Analysen ger resultatet i tabellen nedan. och beräknar följande resultat. Vanligtvis skulle en binär logistisk regressionsanalys ge dig mer effekt än detta, men idag kommer vi att fokusera på oddskvoten.
Prediktor |
p-värde |
Oddsförhållande |
Kön | ||
SDRS-poäng |
Som vi täckte ovan är en av dessa prediktorer binär och den andra är kontinuerlig. Det betyder att vi måste tolka de två lite annorlunda. Först är den binära poängen: kön. Vi tittar först på p-värdet. Det ligger under .05 och berättar att det är viktigt och vi kan säkert tolka oddskvoten. För att tolka detta resultat måste vi veta vad en 0 (låg) och en 1 (hög) motsvarar, och vår forskare påminner om att hon kodade detta som 0 = kvinna och 1 = man. Hon tycker att det här är en bra sak, för när oddskvoten är större än 1 beskriver det ett positivt förhållande. Det positiva förhållandet innebär att när kön ”ökar” ökar oddsen för att ätas. Baserat på vår kodning betyder en ”ökning” i kön ett kön på 1 istället för 0 – med andra ord att vara man. Detta kan tolkas så att det att vara i (1) -gruppen, eller vara manlig, ger dig fem gånger större odds för att bli ätit.
Om oddskvoten för kön hade varit under 1 skulle hon har varit i trubbel, eftersom ett oddsförhållande mindre än 1 innebär ett negativt förhållande. Detta innebär att vara manlig skulle motsvara lägre odds för att ätas. För att sätta detta i perspektiv, om hon hade kodat hane som 0 och hona som 1, skulle samma oddskvot ha vänt om till 0,2 eller (1/5). Detta betyder fortfarande att kvinnor hade mindre odds för att ätas, eftersom oddskvoten skulle ha varit mindre än 1.
Nästa är resultatet för vår fiktiva läckerhetsskala. Den har ett p-värde på .001, vilket är lägre än standardavgränsningen .05, så denna variabel är signifikant. Eftersom denna variabel är kontinuerlig är tolkningen av oddskvoten lite annorlunda, men vi kan använda samma logik. Detta oddsförhållande tolkas i termer av varje enhetsökning på skalan (dvs. går från 1 till 2, 2 till 3, etc.). För varje ökning av läckerhetspoängen ökar oddsen för att ätas av en käftliknande monstrositet med en faktor 2. Detta innebär att någon med poängen 2 på skalan är 2 gånger mer sannolikt att ätas än någon med poängen 1. På samma sätt inverteras oddsen för någon med poängen 1 därifrån (1/2), eller .5, för att beskriva hur mycket mindre sannolikt de äts än någon med poängen 2. Alla av dessa är i förhållande till någon med intilliggande poäng (dvs. 1 mot 2, 2 mot3 och så vidare). Men för att jämföra någon med poängen 2 till någon med en 5, börjar saker och ting lägga sig …
Vid en läckerhet på 2 är oddsen två gånger mer sannolik än 1; vid 3 är oddsen 4 gånger mer sannolik än 1 (eftersom de är 2 gånger mer sannolika än en läckerhet på 2, vilket är 2 gånger mer sannolikt än en poäng på 1). Efter denna logik, och hoppa över mer än en punkt i taget, använder du följande ekvation: (Odds Ratio ^ antal skillnader i intervall) = skillnad i odds. Så för någon med poängen 5 (4 intervall från poängen 1) är deras odds för att ätas (2 ^ 4) 16 gånger större än någon med poängen 1.
För att avsluta , det viktiga att komma ihåg om oddskvoten är att ett oddskvot större än 1 är en positiv koppling (dvs. högre tal för prediktorn betyder grupp 1 i utfallet), och en oddskvot mindre än 1 är negativ koppling (dvs. , högre tal för prediktorn betyder grupp 0 i resultatet).