Az odds arányban nincs semmi furcsa: A bináris logisztikus regresszió értelmezése
A bináris logisztikus regresszió nem biztos, hogy a regresszió leggyakoribb formája, de ha használják, akkor sokkal többet okoz. szükség esetén fejfájás. A bináris logisztikai regressziók felhasználásuk és értelmezésük szempontjából nagyon hasonlítanak lineáris megfelelőikre, és az egyetlen valódi különbség itt az általuk használt függő változó típusában mutatkozik meg. Lineáris regresszióban a függő változó (vagy amit megjósolni próbál) folyamatos. Bináris logisztikai regresszió esetén a függő változó bináris, vagyis a változónak csak két lehetséges értéke lehet. Emiatt a bináris logisztikai regresszió értelmezésekor már nem arról beszélünk, hogy független változóink hogyan jósolnak pontszámot, hanem arról, hogy miként jósolják a binárisan függő változó két csoportjának melyikébe kerülnek végül. Ehhez megnézzük az esélyhányadost.
Vegyünk egy bináris logisztikai regressziót egy kutató által, aki nemrég nézte az Állkapcsok filmet, és retteg attól, hogy ugyanaz a sors vár rájuk, mint néhány kevésbé szerencsés szereplő film. Néhány előrejelző változót választ, hogy értékelje annak esélyét, hogy egy óriási emberevő, nagy fehér cápa elfogyassza, a (c) cápával kapcsolatos ízletes skála (SRDS) pontszáma és (b) neme alapján. Mivel meg kell határoznia ezeket a változókat, hogy később értelmezni tudja őket, azonosítja az SRDS skálát 1 és 5 közötti tartományban; ez folyamatos. A nem bináris, csakúgy, mint az eredmény, és ezt újraszerkeszti: 0 = nő és 1 = férfi.
Először összegyűjt néhány adatot mindazokról, akiket egy hatalmas ember eszik fehér cápa a múltban. Miután összegyűjtötte az adatokat és elvégezte az elemzést ezekről a változókról, hogy meghatározza a kapcsolatukat a hatalmas tengeri élőlény idő előtti pusztulásával, megállapítja, hogy maga a regresszió jelentős. Az elemzés az alábbi táblázat eredményét adja. és kiszámítja a következő eredményeket. Jellemzően egy bináris logisztikai regresszió-elemzés ennél több kimenetet adna, de ma az esélyek arányára fogunk koncentrálni.
Jóslás |
p érték |
Esélyarány |
Nem | ||
SDRS pontszám |
Amint fentebb kitértünk rá, az egyik ilyen prediktor bináris, a másik folyamatos. Ez azt jelenti, hogy kicsit másképp kell értelmeznünk a kettőt. Az első a bináris pontszám: nem. Először a p értéket nézzük meg. 0,05 alatt van, elmondva, hogy jelentős, és nyugodtan értelmezhetjük az esélyhányadost. Ennek az eredménynek az értelmezéséhez tudnunk kell, hogy mi felel meg egy 0 (alacsony) és egy 1 (magas) értéknek, és kutatónk emlékeztet arra, hogy ezt 0 = nőnek és 1 = férfinak kódolta. Ezt jó dolognak tartja, mert ha az esélyhányados nagyobb, mint 1, ez pozitív kapcsolatot ír le. A pozitív kapcsolat azt jelenti, hogy a nem “növekedésével” növekszik az evés esélye. Kódolásunk alapján a “nem növekedése” a 0 helyett 1 nemet jelent – más szóval férfit. Ez úgy értelmezhető, hogy az (1) csoportba tartozás vagy férfi lét ötször nagyobb esélyt jelent arra, hogy megegyék.
Ha a nemek esélye 1 alatt lett volna, akkor voltak bajban, mivel az 1-nél kisebb esélyhányados negatív kapcsolatot jelent. Ez azt jelenti, hogy férfinak lenni alacsonyabb eséllyel eszi meg. Ha ezt perspektívába helyezzük, ha a férfit 0-nak, a nőt pedig 1-nek kódolta volna, ugyanazt az esélyarányt fordítottuk volna meg 0,2-re vagy (1/5) -re. Ez még mindig azt jelenti, hogy a nőstényeket kisebb eséllyel evették meg, mivel az esély aránya kevesebb lett volna, mint 1.
A következő a fiktív ízletes skálánk eredménye. Ennek p értéke 0,001, amely alacsonyabb, mint a szokásos, 05-ös határérték, tehát ez a változó jelentős. Mivel ez a változó folyamatos, az esélyhányados értelmezése kissé eltér, de ugyanazt a logikát használhatjuk. Ezt az esélyhányadost úgy értelmezik, hogy az egyes egységek növekednek a skálán (azaz 1-ről 2-re, 2-ről 3-ra stb.). Így az ízletességi pontszámok minden egyes növekedése esetén annak az esélye, hogy egy Jaws-szerű szörnyeteg megeszi, 2-szeresére nő. Ez azt jelenti, hogy a skálán 2-es pontszámmal rendelkező személy kétszer nagyobb eséllyel eszi meg, mint 1-es pontszám. Hasonlóképpen, az 1-es pontszámmal rendelkező ember esélye onnan megfordul (1/2) vagy .5, hogy leírja, mennyivel kevésbé valószínű, hogy megeszik, mint valakit, aki 2-es pontszámmal rendelkezik. ezek viszonyulnak egy szomszédos pontszámmal rendelkező személyhez (azaz 1 vs. 2, 2 vs.3, és így tovább). De ha összehasonlítunk valakit a 2-es pontszámmal az 5-ös ponttal, akkor a dolgok összeadódnak …
A 2-es finomságnál az esély kétszer nagyobb, mint 1; 3-nál az esélyek négyszer nagyobbak, mint 1 (mivel 2-szer nagyobbak, mint a 2-es finomságok, ami kétszer nagyobb valószínűséggel, mint 1-es pontszám). Ezt a logikát követve, egyszerre több mint egy ponttal előreugrva, a következő egyenletet használja: (Odds Ratio ^ intervallumok száma különbség) = odds különbség. Tehát az 5-ös pontszámmal (4 intervallum az 1-es pontról) annak az esélye, hogy megeszik, (2 ^ 4) 16-szor nagyobb, mint az, aki 1-es pontszámmal rendelkezik.
Végezetül , az esélyhányadossal kapcsolatban fontos megjegyezni, hogy az 1-nél nagyobb esélyhányados pozitív asszociáció (azaz a prediktor nagyobb száma az eredmény 1. csoportját jelenti), az 1-nél kisebb szorzószám pedig negatív asszociációt (azaz , a prediktor magasabb száma azt jelenti, hogy a kimenet 0. csoportja).