Regression, logistische im Dorsch Lexikon der Psychologie

Wirtz, Markus

Regression, logistische

[engl. logistic regression; gr. λογιστική (logistike) Rechenkunst], syn. binomiale logistische Regression, [FSE], Regressionsanalyse zur stat. Vorhersage einer dichotomen abhängigen Kriteriumsvariable (z. B. Erfolg «1» = «ja» vs. «0» = «nein»; «1» = «geeignet» vs. «0» = «nicht geeignet») aus einer oder mehreren dichotomen, nominalen (Dummy-Kodierung) oder intervallskalierten Prädiktorvariablen. Der Modellierungsansatz unterscheidet sich von demjenigen der linearen Regressionsanalyse (Regression, lineare) vor allem in zwei Aspekten: (1) Nicht die Werte der Kriteriumsvariable selbst, sondern die Wahrscheinlichkeit des Eintretens der Merkmalsausprägung «1» wird modelliert. (2) Der Zusammenhang zw. den Prädiktorvariablen und der Kriteriumsvariable wird nicht durch eine lineare Funktion (Gerade), sondern durch eine ogivenförmig verlaufende, log. Funktion beschrieben (Link-Funktion). Der Wertebereich der log. Funktion liegt zw. 0 und 1, wodurch insbes. für die durch die logistische Regression vorhergesagten Werte die Interpretation i. S. einer Wahrscheinlichkeit ermöglicht wird. Die Modellschätzung erfolgt mittels der Maximum-Likelihood-Methode.

Die Ähnlichkeit der Modellgleichung zu derjenigen der linearen Regression wird durch die Definiton der sog. Logits möglich. Ein Logit entspricht dem natürlichen Logarithmus der Odds des Ereignisses, also dem Quotienten der Wahrscheinlichkeit des Eintretens des Merkmals und der Wahrscheinlichkeit des Nichteintretens des Merkmals. Angenommen, es liegt nur eine Prädiktorvariable X mit den Ausprägungen $x_{i}$ vor, dann gilt:

$Logit(Y%3D1|x_%7Bi%7D)%3Dln%5Cleft%20(%20%5Cfrac%7BP(Y%3D1|x_%7Bi%7D)%7D%7BP(Y%3D0|x_%7Bi%7D)%7D%20%5Cright%20)$

Diese Logits stehen dann in linearer Abhängigkeit zu der Prädiktorvariablen:

Logit(Y%3D1|x_%7Bi%7D)%3D%5Cbeta%20_%7B0%7D%2B%5Cbeta%20_%7B1%7D%5Ccdot%20x_%7Bi%7D

Bestimmt man die exponentialtransformierten Werte der durch das Verfahren ermittelten β-Gewichte als exp(%5Cbeta%20_%7Bi%7D) , so ermöglicht dies eine Interpretation im Sinne des Odds Ratio. Angenommen, es wurde für den dichotomen Prädiktor Rauchen («ja» vs. «nein») ein Wert von %5Cbeta%20_%7B1%7D%3D%2C695 zur Vorhersage einer Lungenkrebserkrankung ermittelt. Dann ergibt sich exp(%5Cbeta%20_%7B1%7D)%3D2%2C00 . Dieser Wert kann so interpretiert werden, dass sich die Chance (Odds) für den Eintritt einer Lungenkrebserkrankung verdoppelt, wenn bekannt ist, dass eine Person raucht. Werte von > 1 können i. S. einer Risikoerhöhung und Werte von exp(%5Cbeta%20_%7B1%7D)%3C1 können i. S. einer Riskoverringerung interpretiert werden. Liegt eine intervallskalierte Prädiktorvariable vor, so gibt exp(%5Cbeta%20_%7Bi%7D) an, in welchem Maße die Chance für das Ereignis mit der Erhöhung der Prädiktorvariablen um eine Einheit zunimmt.

Folg. Möglichkeiten stehen zur Testung der Bedeutsamkeit der Prädiktoren und zur Beurteilung der Modellgüte zur Verfügung: Signifikanztestung der β-Gewichte: Wald-Statistik, Likelihood-Ratio; Aufgeklärte Information im Kriterium: Pseudo-R-Quadrat, ROC-Analyse; Globale Datenpassung: Hosmer-Lemeshow-Test. ROC, ROC-Kurve

Referenzen und vertiefende Literatur

Die Literaturverweise stehen Ihnen nur mit der Premium-Version zur Verfügung.

Über die Premium-Version