Na poměru kurzů není nic zvláštního: Interpretace binární logistické regrese
Binární logistická regrese nemusí být nejběžnější formou regrese, ale pokud je použita, má tendenci způsobovat mnohem více bolest hlavy, než je nutné. Binární logistické regrese jsou velmi podobné jejich lineárním protějškům z hlediska použití a interpretace a jediný skutečný rozdíl zde je v typu závislé proměnné, kterou používají. V lineární regrese je závislá proměnná (nebo to, co se snažíte předpovědět) spojitá. V binární logistické regrese je závislá proměnná binární, což znamená, že proměnná může mít pouze dvě možné hodnoty. Z tohoto důvodu při interpretaci binární logistické regrese již nemluvíme o tom, jak naše nezávislé proměnné předpovídají skóre, ale jak předpovídají, do které ze dvou skupin binárně závislých proměnných lidé nakonec spadnou. Za tímto účelem se podíváme na poměr šancí.
Zvažte binární logistickou regresi provedenou výzkumným pracovníkem, který nedávno sledoval film Čelisti a je vyděšený z toho, že bude čelit stejnému osudu jako některé z méně šťastných postav v tom. film. Vybírá několik proměnných prediktorů, aby posoudila své šance na to, že by sežrala obří bílý žralok, který by jedl, na základě (a) skóre na škále lahůdek souvisejících se žraloky (SRDS) a (b) jejího pohlaví. Protože musí tyto proměnné definovat, aby je mohla později interpretovat, identifikuje stupnici SRDS v rozsahu od 1 do 5; to je spojité. Pohlaví je binární, stejně jako výsledek, a překóduje to na 0 = žena a 1 = muž.
Začíná shromažďováním některých údajů o všech těch, kteří byli sežráni obřím člověkem, který jedl velký bílý žralok v minulosti. Poté, co shromáždila data a provedla analýzu těchto proměnných, aby zjistila jejich vztah s předčasným zánikem tohoto obrovského mořského tvora, zjistí, že samotná regrese je významná. Analýza vytvoří výstup v tabulce níže. a vypočítá následující výsledky. Binární logistická regresní analýza vám obvykle poskytne více výstupů, ale dnes se zaměříme na poměr šancí.
Predictor |
p hodnota |
Poměr šancí |
Pohlaví | ||
skóre SDRS |
Jak jsme popsali výše, jeden z těchto prediktorů je binární a druhý spojitý. To znamená, že musíme tyto dva interpretovat trochu odlišně. První je binární skóre: pohlaví. Nejprve se podíváme na hodnotu p. Je nižší než 0,05, což nám říká, že je to významné, a můžeme bezpečně interpretovat poměr šancí. Abychom mohli interpretovat tento výsledek, musíme vědět, co odpovídá 0 (nízká) a 1 (vysoká), a náš výzkumník připomíná, že to kódovala jako 0 = žena a 1 = muž. Považuje to za dobrou věc, protože když je poměr šancí větší než 1, popisuje to pozitivní vztah. Pozitivní vztah znamená, že jak se „zvyšuje pohlaví“, zvyšuje se šance na požití. Na základě našeho kódování „nárůst“ pohlaví znamená pohlaví 1 místo 0 – jinými slovy, být mužem. To lze vykládat v tom smyslu, že když jste ve skupině (1) nebo že jste muž, máte 5krát větší pravděpodobnost, že budete jíst.
Pokud by poměr šancí na pohlaví byl pod 1, byla by měli potíže, protože poměr šancí menší než 1 znamená negativní vztah. To znamená, že být mužem by odpovídalo nižší pravděpodobnosti, že budete snědeni. Abychom to uvedli na pravou míru, pokud by kódovala muže jako 0 a ženu jako 1, stejný poměr šancí by byl obrácen na 0,2 nebo (1/5). To stále znamená, že ženy měly menší pravděpodobnost, že budou zkonzumovány, protože poměr šancí by byl menší než 1.
Další je výsledkem naší fiktivní škály lahodnosti. Má hodnotu p 0,001, která je nižší než standardní mezní hodnota 0,05, takže tato proměnná je významná. Protože tato proměnná je spojitá, interpretace poměru šancí je trochu odlišná, ale můžeme použít stejnou logiku. Tento poměr šancí je interpretován z hlediska zvýšení každé jednotky na stupnici (tj. Od 1 do 2, 2 až 3 atd.). Proto se při každém zvýšení skóre lahodnosti zvyšuje pravděpodobnost, že vás zničí příšernost podobná Jaws, o faktor 2. To znamená, že někdo, kdo má skóre 2 na stupnici, je dvakrát větší pravděpodobnost, že bude jíst, než někdo s skóre 1. Podobně jsou šance někoho se skóre 1 obráceny odtamtud (1/2) nebo 0,5, aby bylo možné popsat, o kolik je méně pravděpodobné, že budou konzumovány, než někdo se skóre 2. Všechny z nich jsou ve vztahu k někomu se sousedním skóre (tj. 1 vs. 2, 2 vs.3 atd.). Ale když porovnáme někoho se skóre 2 s někým s 5, věci se začnou sčítat …
Při lahodnosti 2 je pravděpodobnost 2krát pravděpodobnější než 1; při 3 jsou šance 4krát pravděpodobnější než 1 (protože jsou 2krát vyšší pravděpodobnost než lahodnost 2, což je 2krát vyšší pravděpodobnost než skóre 1). V návaznosti na tuto logiku, při přeskakování více než jednoho bodu najednou, použijete následující rovnici: (Kurzový poměr ^ počet intervalů rozdíl) = rozdíl v kurzech. Takže u někoho, kdo má skóre 5 (4 intervaly od skóre 1), je jeho šance na konzumaci (2 ^ 4) 16krát větší než u někoho se skóre 1.
Na závěr , je důležité si pamatovat na poměr šancí je, že poměr šancí větší než 1 je pozitivní asociace (tj. vyšší číslo pro prediktor znamená ve výsledku skupinu 1) a poměr šancí menší než 1 je negativní asociace (tj. , vyšší číslo pro prediktor znamená ve výsledku skupinu 0).