Erweiterte Regression


Universität Innsbruck
Institut für Mathematik

 Alexander Ostermann
Christian Reisecker
Markus Unterweger

unter Mitarbeit von:
Michael Oberguggenberger
Janette Walde
 


logomathe


Inhalt: Auf dieser Seite finden Sie das Applet Lineare Regression und Informationen zu seiner Bedienung. Mit dem Applet können Sie lineare Regressionsmodelle mit verschiedenen Modellspezifikationen (Transformationen der unabhängigen Variablen) berechnen. Sie können die Daten entweder selbst eingegeben oder mit einigen bereitgestellten Datensätzen experimentieren. Zusätzlich ist es möglich, die Daten aus einer Textdatei zu lesen und in eine Textdatei zu speichern.

Applet

Download Applet

Literaturhinweise

  • A. Chevan, M. Sutherland, Hierarchical partitioning. The American Statistician 45(1991), 90 - 96
  • W. Kruskal, Relative importance by averaging over orderings. The American Statistician 41(1987), 6 - 10
  • N. Fickel, Partition of the coefficient of determination in multiple regression. In: K. Inderfurth, G. Schwödiauer, W. Domschke, F. Juhnke, P. Kleinschmidt, G. Wäscher (Hrsg.), Operations Research Proceedings 1999. Springer, Berlin 2000, 154 - 159
  • N. Fickel, Sequential regression: a neodescriptive approach to multicollinearity. Paper ewp-em/0004009, EconWPA (2000)
  • D.C. Montgomery, E.A. Peck, Introduction to Linear Regression Analysis. John Wiley & Sons, New York 1982.
  • M. Oberguggenberger, A. Ostermann, Analysis für Informatiker. Springer-Verlag, Berlin 2005

Hilfe zur Bedienung

Hier finden Sie Erläuterungen und Quellenangaben zu den im Applet verwendeten Beispieldatensätzen.

Der erste Schritt ist die Daten, für die Sie eine lineare Regression durchführen wollen, auszuwählen. Hierzu können Sie entweder mit Hilfe der Auswahlbox Beispiel laden bei Datenbeispiele einen der gespeicherten Datensätze laden oder selbst eigene Daten eingeben unter Datenmatrix erzeugen. Geben Sie in den Feldern Anzahl Variablen und Datensätze die Anzahl der Variablen und die Anzahl der Datensätze (Anzahl der Beobachtungen) Ihres Datenbeispiels ein. Nach dem Drücken von Erzeuge wird eine leere Matrix erzeugt, in der Sie Ihre Daten eingeben können.

Applikation: Wird die lineare Regression als Applikation gestartet, so können Sie zusätzlich mit dem Button Laden Daten aus einer Textdatei laden. Mit dem Button Speichern können Sie die aktuelle Datenmatrix in eine Textdatei abspeichern. Beispiel einer Textdatei: Biometrik1.txt
Um nun eine Regression durchzuführen, geben Sie im Feld abhängige Variable (y) die Variable an, die erklärt werden soll (die einzelnen Variablen können durch "x1,..., xn"; angesprochen werden). Im Feld Modellspezifikation geben Sie dann durch Beistriche getrennt die unabhängigen Variablen ein. Sie können auch Transformationen der unabhängigen Variablen eingeben. Haben Sie z.B. wie oben im Screenshot ein Datenbeispiel in 3 Variablen und wollen die erste Variable x1 durch eine Linearkombination der anderen beiden Variablen x2, x3 erklären, also das Modell x1 = b0 + b1 x2 + b2 x 3 betrachten, dann müssen Sie im Feld abhängige Variable "x1" und im Feld Modellspezifikation "x2, x3" eingeben. Sie können aber auch Transformationen von Variablen eingeben wie z.B. x1 = b0+ b1 x2 x3 + b2 cos(x2) + b3 x2 2. Für dieses Beispiel müssen Sie im Feld Modellspezifikation einfach "x2*x3, cos(x2), x2^2" eingeben. Beachten Sie, dass die Konstante b0 immer im Modell ist. Um die Regression durchzuführen, drücken Sie dann den Knopf Regression. Bei erfolgreicher Durchführung der Regression (falls die Regression z.B. wegen einer Datenmatrix mit nicht vollem Rang scheitert, wird eine entsprechende Meldung ausgegeben) können Sie im Reiter Ausgabe I die Ergebnisse ansehen. Neben den Standardergebnissen

  • Bestimmtheitsmaß (R²),
  • Gesamtvariabilität,
  • Erklärte Variabilität (Sum of Squares - Regression) und
  • Restvariabilität (Sum of Squares - Error)

wird in einem Kuchendiagramm der mittlere Erklärungsanteil der einzelnen Variablen dargestellt. Die Vorgangsweise bei der Berechnung des mittleren Erklärungsanteils wird im Abschnitt 18.4 des Lehrbuchs Analysis für Informatiker, Springer-Verlag 2005, erläutert. Da die Berechnung des mittleren Erklärungsanteils sehr aufwändig ist, wird dieser nur berechnet, falls die Anzahl der unabhängigen Variablen inkl. möglicher Transformationen kleiner gleich 7 ist. Bei erfolgreicher Durchführung der Regression können Sie im Reiter Ausgabe II die Kenngrößen der Regression tabellarisch ansehen. Berechnet werden

  • Anzahl der Beobachtungen,
  • Bestimmtheitsmaß (R²),
  • Standardfehler der Regression,
  • F-Statistik,
  • p-Wert der F-Statistik sowie
  • Koeffizienten mit
    • Standardfehler und
    • zweiseitiger p-Wert der T-Statistik

Bei erfolgreicher Durchführung der Regression können Sie im Reiter Plot die Daten und Ergebnisse der Regression visualisieren. Für die X- bzw. Y-Achse stehen Ihnen folgende Möglichkeiten zur Verfügung.

  • abhängige Variable (y) z.B.: x1
  • unabhängige Variable(n) z.B.: x2, x3
  • transformierte Variable(n) z.B.: sin(x2), x3^2, x2*x3
  • Residuen
  • Schätzwerte für die abhängige Variable y

Wählen Sie nur die abhängige oder nicht transformierte unabhängige Variablen, so werden die Punkte des Plots grün eingezeichnet. Sind die Punkte des Graphen grün, so können sie mittels "drag and drop" verschoben werden. Die Regression wird interaktiv beim Verschieben der Punkte neu berechnet.

Falls Sie weitere Fragen zum Applet haben, uns Hinweise auf Fehler oder Kommentare zukommen lassen wollen, schreiben Sie uns bitte.

Nach oben scrollen