Workshop 7
Einführung in lineare und logistische Regressionsanalysen
Priv.-Doz. Dr. Christa Monika Reisinger
Universität Potsdam
7. Juli, 8.30 Uhr bis 8. Juli 2022, 15.00 Uhr
Die Regressionsanalyse ist ein flexibles statistisches Verfahren zur Modellierung von Beziehungen zwischen unterschiedlichen Variablen. Dieser Workshop bietet die Möglichkeit, solche Modelle mit der frei erhältlichen Software R zu berechnen und zu visualisieren. Als Benutzeroberfläche wird der R Commander (Paket Rcmdr) verwendet, - eine Option, die der Oberfläche von SPSS sehr ähnlich ist und somit komfortable Analysen ermöglicht. Neben den Anwendungen über das Menü wird von R automatisch eine Syntax geschrieben, die für spätere Anwendungen als Grundlage herangezogen und nachträglich per Hand modifiziert werden kann. Das nötige Grundwissen für Analysen in R wird zu Beginn des Workshops vermittelt.
Ausgehend von der einfachen (bivariaten) linearen Regression wird in diesem Workshop anhand von Praxisbeispielen in Kleinschritten in die multiple und anschließend in die logistische Regression eingeführt.
Die multiple (lineare) Regression ist die Erweiterung der einfachen bivariaten Regression mit zusätzlichen unabhängigen Variablen (Prädiktoren). Sie testet, ob ein linearer Zusammenhang zwischen mehreren Prädiktoren und einer metrischen Response-Variablen besteht.
Beispielsweise könnte damit untersucht werden, welchen Einfluss Leistungsmotivation, Intelligenz sowie Interesse am Schulfach auf die entsprechenden Schulnoten ausüben.
Die logistische Regressionsanalyse hingegen wird angewendet, wenn geprüft werden soll, ob ein Zusammenhang zwischen einer diskreten abhängigen Variablen und einer oder mehreren Prädiktoren besteht. Typische Anwendungsfälle sind das Erklären von Drop-out oder von Bestehen/Nicht-Bestehen einer Prüfung aufgrund einer oder mehrerer Prädiktorvariablen (binäre logistische Regression).
Im Unterschied zur linearen Regression wird in der logistischen Regression nicht das Ausmaß einer metrischen abhängigen Variablen vorhergesagt, sondern die Wahrscheinlichkeiten für das Eintreten oder Nicht-Eintreten eines zweistufigen Merkmals. Erweiterungen dieser Methode erlauben auch eine adäquate Erklärung mehrstufiger Merkmale (multinomiale logistische Regression).
Unmittelbar anschließend an jeden Themenbereich erfolgen analoge Aufgaben an einfachen Übungsdatensätzen zum selbständigen Anwenden, Ausprobieren bzw. Konsolidieren der neu erworbenen Kenntnisse. Somit wird ein hoher Anteil an praktischen Übungsphasen zum Sammeln von Erfahrungen gewährleistet.
Am Ende dieses Workshops sollen die Teilnehmenden diese gängigen Regressionsmodelle mit R so weit beherrschen, dass sie unter Beachtung statistischer Gütekriterien selbständig eigene Regressionsmodelle entwickeln und analysieren können.
Buchempfehlung (Grundlage für Installation, Basiskenntnisse und Workshop)
Reisinger, C.-M. & Wagner, G. (2017): „AlleR Anfang ist leicht. Datenanalyse mit dem R Commander“, Wien: facultas
Voraussetzungen für den Workshop
Es werden grundlegende Statistikkenntnisse vorausgesetzt.
Für eine aktive Teilnahme ist das Mitbringen eines eigenen Laptops erforderlich. Es wird aus Zeitgründen empfohlen, die aktuelle Version von R und der grafischen Benutzeroberfläche R Commander (Paket Rcmdr) sowie die u. g. Pakete bereits vor dem Workshop zu installieren.
Folgende Dinge werden benötigt:
- Die aktuelle Version von R https://cran.r-project.org/
(Download Auswahl je nach Betriebssystem)
- Integration des R Commanders (Paket Rcmdr) nach der Installation von R. Dazu siehe im
Internet: https://socialsciences.mcmaster.ca/jfox/Misc/Rcmdr/installation-notes.html
- R-Pakete (Funktionserweiterungen für R): stat, jmv;
Kostenbeitrag für den Workshop:
Reduzierte Teilnahmegebühr für Studierende (BA, MA, PhD): € 70.-
Reguläre Teilnahmegebühr: € 110.-