Regression, lineare

 

[engl. linear regression], [FSE], Regressionsanalyse, bei der ein linearer Zusammenhang zw. einer Kriteriumsvariablen Y und einer (einfache lineare Regression) oder mehreren (multiple lineare Regression) Prädiktorvariablen X_%7Bk%7D angenommen wird. Die Prädiktorvariablen müssen dichotom (ggf. auch nominalskalierte Variablen nach Dummy-Codierung oder intervallskaliert sein (Skalenniveau). Im Falle einer Prädiktorvariablen lautet die Modellgleichung:

y_%7Bij%7D%3Db_%7B0%7D%2Bb_%7B1%7D%5Ccdot%20x_%7Bi%7D%2Be_%7Bij%7D

y_%7Bij%7D = Messwert in der Kriteriumsvariablen bei Person i

x_%7Bi%7D = Messwert in der Prädiktorvariablen bei Person i

b_%7B0%7D bzw. b_%7B1%7D = Regressionsgewichte

e_%7Bij%7D = Vorhersagefehler

Im Rahmen der linearen Regression werden die Regressionswichte so bestimmt, dass die Kriteriumswerte y_%7Bij%7D optimal vorhergesagt werden (Methode der kleinsten Quadrate). Im Falle eines signifikanten Wertes (Signifikanz) von %5Cbeta_%7B1%7D%7D können für jede Pb aufgrund des Wertes in der Prädiktorvariablen X Schätzwerte %5Chat%7By%7D_%7Bi%7D bestimmt werden. Die Güte der Vorhersage wird über r%5E%7B2%7D (Determinationskoeffizient) als Maß der Varianzaufklärung abgebildet. Dieses entspricht im Falle der einfachen linearen Regression dem Quadrat der Produkt-Moment-Korrelation der Variablen X und Y.

Werden n Prädiktorvariablen X_%7B1%7D...X_%7Bn%7D simultan berücksichtigt, so lautet die multiple Vorhersagegleichung:

y_%7Bij%7D%3Db_%7B0%7D%2Bb_%7B1%7D%5Ccdot%20x_%7B1i%7D%2B...%2Bb_%7Bn%7D%5Ccdot%20x_%7Bni%7D%2Be_%7Bij%7D

%3Db_%7B0%7D%2B%5Cleft%20(%5Csum_%7Bk%3D1%7D%5E%7Bn%7Db_%7Bk%7D%5Ccdot%20x_%7Bki%7D%20%5Cright%20)%2Be_%7Bij%7D

Bei der Schätzung der Regressionsgewichte wird redundante Information in den Prädiktoren kontrolliert, sodass ein Prädiktor, der hoch mit den übrigen Prädiktoren korreliert, i. d. R. keine oder nur eine schwache zusätzliche Varianzaufklärung ermöglicht. Korrelieren zwei Variablen X_%7Bi%7D und X_%7Bj%7D bivariat gleich stark mit der Kriteriumsvariblen Y, so leistet diejenige Prädiktorvariable i. d. R. die höhere zusätzliche Varianzaufklärung, die in geringerem Maße mit den übrigen Prädiktorvariablen in Zusammenhang steht. Für die multiple lineare Regression wird das multiple R%5E%7B2%7D als Varianzaufklärungsmaß angegeben.

Da auch dichotome und nominalskalierte Prädiktoren berücksichtigt werden können, kann im Rahmen des Allgemeinen Linearen Modells gezeigt werden, dass die Varianzanalyse einen Spezialfall der lineare Regression darstellt. Allgemeines Lineares Modell (ALM), Supressorvariable.

Referenzen und vertiefende Literatur

Die Literaturverweise stehen Ihnen nur mit der Premium-Version zur Verfügung.

Datenschutzeinstellungen

Wir verwenden Cookies und Analysetools, um die Sicherheit und den Betrieb sowie die Benutzerfreundlichkeit unserer Website sicherzustellen und zu verbessern. Weitere informationen finden Sie unter Datenschutz. Da wir Ihr Recht auf Datenschutz respektieren, können Sie unter „Einstellungen” selbst entscheiden, welche Cookie-Kategorien Sie zulassen möchten. Bitte beachten Sie, dass Ihnen durch das Blockieren einiger Cookies möglicherweise nicht mehr alle Funktionalitäten der Website vollumfänglich zur Verfügung stehen.