Il n’y a rien d’étrange dans le rapport de cotes: Interprétation de la régression logistique binaire
La régression logistique binaire n’est peut-être pas la forme de régression la plus courante, mais lorsqu’elle est utilisée, elle a tendance à causer beaucoup plus de un mal de tête que nécessaire. Les régressions logistiques binaires sont très similaires à leurs homologues linéaires en termes d’utilisation et d’interprétation, et la seule vraie différence ici réside dans le type de variable dépendante qu’elles utilisent. Dans une régression linéaire, la variable dépendante (ou ce que vous essayez de prédire) est continue. Dans une régression logistique binaire, la variable dépendante est binaire, ce qui signifie que la variable ne peut avoir que deux valeurs possibles. Pour cette raison, lors de l’interprétation de la régression logistique binaire, nous ne parlons plus de la façon dont nos variables indépendantes prédisent un score, mais de la manière dont elles prédisent dans lequel des deux groupes de la variable dépendante binaire les gens finissent par tomber. Pour ce faire, nous examinons le rapport de cotes.
Prenons une régression logistique binaire menée par un chercheur qui a récemment regardé le film Jaws et qui est terrifié à l’idée de subir le même sort que certains des personnages les moins fortunés. film. Elle choisit quelques variables prédictives pour évaluer ses chances d’être mangée par un grand requin blanc géant mangeant d’hommes, en se basant sur (a) le score de l’échelle de délices liés au requin (SRDS) et (b) son sexe. Puisqu’elle doit définir ces variables pour pouvoir les interpréter plus tard, elle identifie l’échelle SRDS comme allant de 1 à 5; c’est continu. Le sexe est binaire, tout comme le résultat, et elle le recode comme 0 = féminin et 1 = masculin.
Elle commence par rassembler des données sur tous ceux qui ont été mangés par un grand mangeur d’hommes géant requin blanc dans le passé. Après avoir collecté les données et exécuté l’analyse de ces variables pour déterminer leur relation avec la mort prématurée de cette énorme créature marine, elle constate que la régression elle-même est significative. L’analyse produit la sortie dans le tableau ci-dessous. et calcule les résultats suivants. En règle générale, une analyse de régression logistique binaire vous donnerait plus de résultats que cela, mais nous nous concentrerons aujourd’hui sur le rapport de cotes.
Prédicteur |
valeur p |
Rapport de cotes |
Sexe | ||
Score SDRS |
Comme nous l’avons vu ci-dessus, l’un de ces prédicteurs est binaire et l’autre est continu. Cela signifie que nous devons interpréter les deux un peu différemment. Le premier est le score binaire: le sexe. Nous regardons d’abord la valeur p. Il est inférieur à 0,05, ce qui nous indique qu’il est significatif, et nous pouvons interpréter le rapport de cotes en toute sécurité. Pour interpréter ce résultat, nous devons savoir à quoi correspondent un 0 (faible) et un 1 (élevé), et notre chercheuse rappelle qu’elle a codé cela comme 0 = femme et 1 = homme. Elle trouve que c’est une bonne chose car lorsque le rapport de cotes est supérieur à 1, cela décrit une relation positive. La relation positive signifie qu’à mesure que le sexe «augmente», les chances d’être mangé augmentent. Selon notre codage, une «augmentation» du sexe signifie un sexe de 1 au lieu de 0 – en d’autres termes, être un homme. Cela peut être interprété comme signifiant qu’être dans le groupe (1), ou être un homme, vous met 5 fois plus de chances d’être mangé.
Si le rapport de cotes pour le sexe était inférieur à 1, elle le ferait ont été en difficulté, car un rapport de cotes inférieur à 1 implique une relation négative. Cela signifie qu’être un homme correspondrait à une probabilité plus faible d’être mangé. Pour mettre cela en perspective, si elle avait codé masculin comme 0 et féminin comme 1, le même rapport de cotes aurait été inversé à 0,2, ou (1/5). Cela signifie toujours que les femmes avaient moins de chances d’être mangées, car le rapport de cotes aurait été inférieur à 1.
Voici le résultat de notre échelle de délices fictive. Il a une valeur p de 0,001, qui est inférieure au seuil standard de 0,05, donc cette variable est significative. Parce que cette variable est continue, l’interprétation de l’odds ratio est un peu différente, mais nous pouvons utiliser la même logique. Ce rapport de cotes est interprété en termes d’augmentation de chaque unité sur l’échelle (c’est-à-dire allant de 1 à 2, 2 à 3, etc.). Ainsi, pour chaque augmentation du score de délice, les chances d’être mangé par une monstruosité de type Jaws augmentent d’un facteur de 2. Cela signifie qu’une personne avec un score de 2 sur l’échelle est 2 fois plus susceptible d’être mangée qu’une personne avec un score de 1. De même, les chances d’une personne avec un score de 1 sont inversées à partir de là (1/2), ou 0,5, pour décrire à quel point elle est moins susceptible d’être mangée que quelqu’un avec un score de 2. Tous de ceux-ci sont liés à quelqu’un avec un score adjacent (c.-à-d. 1 contre 2, 2 contre3, et ainsi de suite). Mais pour comparer quelqu’un avec un score de 2 à quelqu’un avec un 5, les choses commencent à s’additionner…
À un délicieux de 2, les chances sont 2 fois plus probables que 1; à 3, les probabilités sont 4 fois plus élevées que 1 (puisqu’elles sont 2 fois plus probables qu’un délicieux de 2, ce qui est 2 fois plus probable qu’un score de 1). En suivant cette logique, en sautant plus d’un point à la fois, vous utilisez l’équation suivante: (Odds Ratio ^ nombre d’intervalles différence) = différence de cotes. Ainsi, pour une personne avec un score de 5 (4 intervalles sur un score de 1), ses chances d’être mangées sont (2 ^ 4) 16 fois plus élevées qu’une personne avec un score de 1.
Pour conclure , la chose importante à retenir à propos du rapport de cotes est qu’un rapport de cotes supérieur à 1 est une association positive (c’est-à-dire qu’un nombre plus élevé pour le prédicteur signifie le groupe 1 dans le résultat), et un rapport de cotes inférieur à 1 est une association négative (c.-à-d. , un nombre plus élevé pour le prédicteur signifie le groupe 0 dans le résultat).