EXCEL Multiple Regression
A. Colin Cameron, Dept. of Economics, Univ. von Calif. - Davis
Multiple Regression der Datenanalyse ADD-IN VERWENDUNG
Wir erstellen dann eine neue Variable in Zellen C2: C6, in Würfel geschnitten Haushaltsgröße als Regressor.
Dann in der Zelle C1 geben die die Überschrift CUBED HH SIZE.
(Es stellt sich heraus, dass für die se Daten squared HH SIZE einen Koeffizienten von exakt 0,0 der Würfel hat verwendet wird).
Die Tabelle Zellen A1: C6 sollte wie folgt aussehen:
Wir haben Regression mit einem Intercept und der Regressoren HH SIZE und CUBED HH SIZE
Die Bevölkerung Regressionsmodell ist: y = β1 + β2 + β3 x2 x3 + u
Es wird angenommen, dass der Fehler u unabhängig mit konstanter Varianz (homoskedastic) - siehe EXCEL GRENZEN an der Unterseite.
Wir tun dies mit der Datenanalyse-Add-in und Regression.
Die einzige Änderung gegenüber einer Variablen Regression ist mehr als eine Spalte in der Eingabe-X-Strecke umfassen.
Beachten Sie jedoch, dass die Regressoren in zusammenhängenden Spalten sein müssen (hier Spalten B und C).
Ist dies nicht der Fall in der ursprünglichen Daten ist, dann müssen Spalten kopiert werden, um die Regressoren in angrenzenden Spalten zu erhalten.
Schlagen OK wir bekommen
Die Regressions Ausgabe besteht aus drei Komponenten:
Dies ist die folgende Ausgabe. Von größtem Interesse ist R-Platz.
Gesamtsummen der Quadrate
= Residual (oder Fehler) + Summe der Quadrate Regression (oder erklärt) Summe der Quadrate.
Die Spalte mit der Bezeichnung F ergibt den Gesamt F-Test von H0: β2 und β3 = 0 = 0 im Vergleich zu Ha: mindestens eines von β2 und β3 ist nicht gleich Null.
Abgesehen: Excel berechnet F dies als:
F = [Regression SS / (k-1)] / [Residual SS / (n-k)] = [1,6050 / 2] / [0,39498 / 2] = 4,0635.
Die Spalte mit der Bezeichnung Bedeutung F hat den zugehörigen P-Wert.
Da 0,1975> 0,05, lehnen wir nicht H0 auf signficance Ebene 0,05.
Anmerkung: Bedeutung F im allgemeinen = FINV (F, K-1, n-k), wobei k die Anzahl der Regressoren einschließlich hte intercept ist.
Hier FINV (4.0635,2,2) = 0,1975.
INTERPRETIEREN Regressionskoeffizienten TABLE
Die Regressions Ausgabe von größtem Interesse ist die folgende Tabelle von Koeffizienten und zugeordneten Ausgang:
Lassen ßj die Bevölkerung Koeffizient des j-ten Regressor- bezeichnen (abfangen, HH SIZE und CUBED HH SIZE).
y = 0,8966 + 0,3365 * x + 0,0021 * z
CO NFIDENCE Intervalle für KOEFFIZIENTEN SLOPE
95% Konfidenzintervall für Steigungskoeffizient β2 ist aus Excel Ausgang (-1,4823, 2,1552).
Excel berechnet dies als
b2 ± t_.025 (3) & times; se (b2)
= 0,33647 ± TINV (0,05, 2) × 0,42270
= 0,33647 ± 4,303 × 0,42270
= 0,33647 ± 1,8189
= (-1,4823, 2,1552).
Andere Konfidenzintervall erhalten werden.
Zum Beispiel, 99% Konfidenzintervall zu finden: im Dialogfeld Regression (in dem Datenanalyse-Add-in),
überprüfen Sie die Confidence Level-Box und stellen Sie den Pegel auf 99%.
TEST Hypothese ZERO SLOPE KOEFFIZIENT ( „TEST der statistischen Signifikanz“)
Der Koeffizient der HH Größe hat, Standardfehler von 0,4227, t-Test von 0,7960 und p-Wert von 0,5095 geschätzt.
Es ist daher statistisch nicht signifikant auf Signifikanzniveau α = .05 als p> 0,05.
Der Koeffizient der CUBED HH Größe hat, Standardfehler von 0,0131, t-Test von 0,1594 und p-Wert von 0,8880 geschätzt.
Es ist daher statistisch nicht signifikant auf Signifikanzniveau α = .05 als p> 0,05.
Es gibt 5 Beobachtungen und 3 Regressoren (abfangen und x) so verwenden wir t (5-3) = t (2).
Zum Beispiel für HH SIZE p = = TDIST (0.796,2,2) = 0,5095.
TEST AUF EINEM HYPOTHESE REGRESSION PARAMETER
Hier prüfen wir, ob HH SIZE Koeffizient β2 hat = 1,0.
Beispiel: H0: β2 = 1,0 gegen Ha: β2 ≠ 1,0 bei Signifikanzniveau α = .05.
Unter Verwendung des p-Value-Ansatz
- p-Wert = TDIST (1.569, 2, 2) = 0,257. [Hier n = 5 und k = 3, so n-k = 2].
- auf Stufe .05 da der p-Wert nicht über die Nullhypothese verwerfen ist> 0,05.
- Wir berechnen t = -1,569
- Der kritische Wert ist t_.025 (2) = TINV (0.05,2) = 4.303. [Hier n = 5 und k = 3, so n-k = 2].
- Also nicht ablehnen Nullhypothese auf Stufe .05 seit t = | -1,569 | < 4.303.
GESAMT TEST DER BEDEUTUNG DER Regressionsparameter
Wir testen H0: β2 und β3 = 0 = 0 im Vergleich zu Ha: mindestens eines von β2 und β3 ist nicht gleich Null.
Anmerkung: Bedeutung F im allgemeinen = FINV (F, K-1, n-k), wobei k die Anzahl der Regressoren einschließlich hte intercept ist.
Hier FINV (4.0635,2,2) = 0,1975.
Vorhersagewert Y für Regressoren
Betrachten Fall, wo x = 4 in diesem Fall CUBED HH SIZE = x ^ 3 = 4 ^ 3 = 64.
Excel beschränkt die Anzahl der Regressoren (nur bis zu 16 Regressoren.).
Excel Standardfehler und t-Statistiken und p-Werte basieren auf der Annahme, dass der Fehler unabhängig mit konstanter Varianz (homoskedastic).
Excel bietet keine alternaties, wie asheteroskedastic robuste oder Autokorrelation robuste Standardfehler und T-Statistiken und p-Werte.
Weitere spezialisierte Software wie STATA, EVIEWS, SAS, LIMDEP, PC-TSP. wird gebraucht.