Introductory Econometrics Kapitel 17 F-Tests

Kapitel 17: Gemeinsame Hypothesentests

Kapitel 16 zeigt, wie eine Hypothese über einen Steigungsparameter in einer Regressionsgleichung zu testen. In diesem Kapitel wird erläutert, wie Hypothesen zu testen, um mehr als nur einer der Parameter in einem multiplen Regressionsmodell. Simultaneous multiple Parameter Hypothesenprüfung erfordert im allgemeinen eine Teststatistik erstellt, die den Unterschied in der Passung zwischen zwei Versionen des gleichen Modells misst.

Ein Beispiel für einen Test mit mehr als einem Parameter

Aus Gründen, die offensichtlich werden, nennen wir dies das uneingeschränkte Modell. Die abhängige Variable ist die Sparquote. Alter und Bildungsmaßnahme bzw. das Alter und die Ausbildung des Haushaltsvorstands (beiden Jahre). Der Fehlerterm spiegelt Variablen weggelassen, die Sparquoten sowie den Einfluss von Glück beeinflussen. Der Index h Indizes Haushalte. Eine Reihe von 16 Dummy-Variablen zeigen die nationale Herkunft der Einwanderer; beispielsweise Chinah = 1, wenn Mann und Frau in Haushalt h war Bitterer. (2) Es sei angenommen, dass der Wert für den Koeffizienten multipliziert China 0,12 ist. Dies würde darauf hindeuten, dass mit anderen Faktoren kontrolliert, Einwanderer chinesischer Herkunft eine Sparquote um 12 Prozentpunkte höher als der Basisfall haben (die in dieser Regression von Menschen besteht, die in den Vereinigten Staaten geboren wurden).

Wenn es keine kulturellen Auswirkungen auf die Einsparungen sind, dann alle Koeffizienten der Dummy-Variablen für die nationale Herkunft Multiplikation sollten einander gleich sein. Mit anderen Worten, wenn die Kultur spielt keine Rolle, sollte die nationale Herkunft nicht zu Sparquoten ceteris paribus beeinflussen. Dies ist eine Nullhypothese der 16 Parameter und 16 Gleichheitszeichen:

Die alternative Hypothese negiert einfach die Nullhypothese, was bedeutet, dass Einwanderer aus mindestens einem Land unterschiedliche Sparquoten als Einwanderer aus anderen Ländern haben:

Nun, wenn die Nullhypothese wahr ist, dann eine Alternative, einfacheres Modell beschreibt den Datenerzeugungsprozess:

Die F-Verteilung ist nach Ronald A. Fisher, einem führenden Statistiker der ersten Hälfte des zwanzigsten Jahrhunderts benannt. Dieses Kapitel zeigt, dass die F-Verteilung ein Verhältnis von zwei Chi-Quadrat-Zufallsvariablen ist, und dass, da die Anzahl der Beobachtungen zunimmt, wird die F-Verteilung, die Chi-Quadrat-Verteilung zu ähneln kommt. Karl Pearson popularisierte die Chi-Quadrat-Verteilung im Jahr 1900 beginnen.