승산 비에 대해 이상한 것은 없습니다 : 이진 로지스틱 회귀 해석
이진 로지스틱 회귀는 가장 일반적인 형태의 회귀가 아닐 수 있지만 사용하면 더 많은 문제가 발생하는 경향이 있습니다. 필요 이상으로 두통. 이항 로지스틱 회귀는 사용 및 해석 측면에서 선형 대응과 매우 유사하며 여기서 유일한 실제 차이점은 사용하는 종속 변수 유형입니다. 선형 회귀에서 종속 변수 (또는 예측하려는 항목)는 연속적입니다. 이진 로지스틱 회귀에서 종속 변수는 이진이므로 변수에 가능한 값이 두 개만있을 수 있습니다. 이 때문에 이진 로지스틱 회귀를 해석 할 때 더 이상 독립 변수가 점수를 예측하는 방법에 대해 이야기하지 않고 이진 종속 변수의 두 그룹 중 사람들이 결국 어떤 그룹에 속할지 예측하는 방법에 대해 이야기합니다. 이를 위해 우리는 승산 비를 살펴 봅니다.
최근 영화 죠스를 시청 한 연구원이 수행 한 이진 로지스틱 회귀를 고려해보십시오. 그 안에서 운이 좋지 않은 일부 캐릭터와 같은 운명에 직면하는 것을 두려워합니다. 영화. 그녀는 (a) Shark Related Deliciousness Scale (SRDS)의 점수와 (b) 그녀의 성별을 기반으로 식인 거대 백상어가 먹을 확률을 평가하기 위해 몇 가지 예측 변수를 선택합니다. 나중에 해석 할 수 있도록 이러한 변수를 정의해야하므로 SRDS 척도를 1에서 5까지의 범위로 식별합니다. 이것은 연속적입니다. 성별은 결과와 마찬가지로 이분법 적이며 0 = 여성 및 1 = 남성으로 다시 코딩합니다.
그녀는 거인을 먹는 거인이 먹은 모든 사람들에 대한 데이터를 수집하는 것으로 시작합니다. 과거에 백상아리. 데이터를 수집하고이 변수에 대한 분석을 실행하여이 거대한 바다 생물이시기 적절하게 죽는 것과의 관계를 확인한 후 회귀 자체가 중요하다는 것을 알게됩니다. 분석 결과는 아래 표에 나와 있습니다. 다음과 같은 결과를 계산합니다. 일반적으로 이진 로지스틱 회귀 분석은 이보다 더 많은 결과를 제공하지만 오늘은 승산 비에 초점을 맞출 것입니다.
예측 자 |
p 값 |
배당률 |
성별 | ||
SDRS 점수 |
위에서 설명한 것처럼 이러한 예측 변수 중 하나는 이진이고 다른 하나는 연속적입니다. 이것은 우리가 둘을 조금 다르게 해석해야한다는 것을 의미합니다. 첫 번째는 이진 점수 : 성별입니다. 먼저 p 값을 봅니다. .05 미만으로 중요하며 승산 비를 안전하게 해석 할 수 있습니다. 이 결과를 해석하려면 0 (낮음)과 1 (높음)이 무엇에 해당하는지 알아야하며 연구원은이를 0 = 여성, 1 = 남성으로 코딩했다고 회상합니다. 그녀는 승산 비가 1보다 크면 긍정적 인 관계를 나타 내기 때문에 이것이 좋은 것이라고 생각합니다. 긍정적 인 관계는 성별이 “증가”할수록 먹을 확률이 증가한다는 것을 의미합니다. 우리의 코딩에 따르면 성별의 “증가”는 성별이 0이 아닌 1, 즉 남성임을 의미합니다. 이것은 (1) 그룹에 속하거나 남성이되면 먹을 확률이 5 배 더 높다는 의미로 해석 될 수 있습니다.
성별 확률 비율이 1 미만이면 그녀는 승산 비가 1 미만이면 부정적인 관계를 의미하므로 문제가 발생했습니다. 이것은 남성이 먹을 확률이 낮다는 것을 의미합니다. 이것을 관점에서 말하자면, 그녀가 남성을 0으로, 여성을 1로 코딩했다면, 동일한 승산 비는 0.2 또는 (1/5)로 반전되었을 것입니다. 이것은 승산 비가 1보다 작았 기 때문에 암컷이 먹을 확률이 낮다는 것을 의미합니다.
다음은 가상의 맛도 척도의 결과입니다. p 값은 .001로 표준 .05 컷오프보다 낮으므로이 변수는 중요합니다. 이 변수는 연속적이기 때문에 승산 비의 해석은 약간 다르지만 동일한 논리를 사용할 수 있습니다. 이 승산 비는 척도의 각 단위 증가 (즉, 1에서 2, 2에서 3 등)로 해석됩니다. 따라서 맛 점수가 올라갈 때마다 턱과 같은 괴물이 먹을 확률이 2 배씩 증가합니다. 이는 척도에서 2 점을받은 사람이 사람보다 2 배 더 많이 먹을 가능성이 있음을 의미합니다. 1 점. 마찬가지로 1 점을받은 사람의 확률은 2 점을받은 사람보다 먹을 가능성이 얼마나 적은지를 나타 내기 위해 1 점 (1/2) 또는 .5를 역으로 계산합니다. 이들 중 인접한 점수를 가진 사람과 관련되어 있습니다 (예 : 1 대 2, 2 대3 등). 하지만 점수가 2 점인 사람과 5 점점을받은 사람을 비교해 보면 모든 것이 합산되기 시작합니다…
맛이 2 인 경우 확률은 1 점보다 2 배 더 높습니다. 3에서 확률은 1보다 4 배 더 높습니다 (맛있는 2보다 2 배 더 높기 때문에 1 점보다 2 배 더 높습니다). 이 논리에 따라 한 번에 하나 이상의 포인트를 건너 뛰면 다음 방정식을 사용합니다. (승산 비 ^ 구간 차이 수) = 승산 차이. 따라서 점수가 5 점 (1 점에서 4 구간) 인 사람의 경우 먹을 확률이 1 점인 사람보다 (2 ^ 4) 16 배 더 큽니다.
결론 , 승산 비에 대해 기억해야 할 중요한 점은 승산 비가 1보다 큰 경우 양의 연관 (예 : 예측 변수의 숫자가 높으면 결과에서 그룹 1을 의미 함)이고 승산 비가 1 미만이면 음의 연관 (즉, , 예측 변수의 숫자가 높으면 결과에서 그룹 0을 의미합니다.