Chi-Quadrat-Test der Güte der Anpassung - Handbook of Biological Statistik

Sie verwenden den Chi-Quadrat-Test der Güte der Anpassung, wenn Sie eine Sollgröße haben, wollen Sie sehen, ob die Anzahl der Beobachtungen in jeder Kategorie eine theoretische Erwartung paßt, und die Stichprobengröße ist groß.

Wenn es zu benutzen

Verwenden Sie den Chi-Quadrat-Test der Güte der Anpassung, wenn Sie eine Sollgröße haben mit zwei oder mehr Werten (wie rot, rosa und weißen Blüten). Sie vergleichen die beobachteten Häufigkeiten der Beobachtungen in jeder Kategorie mit den erwarteten Zählwerte, die Sie irgendeine Art von theoretischer Erwartung berechnen (zB 1: 1 Geschlechterverhältnis oder ein 1: 2: 1-Verhältnis in einem genetischen Kreuz).

Nullhypothese

Die statistische Nullhypothese ist, dass die Anzahl der Beobachtungen in jeder Kategorie, dass durch eine biologische Theorie vorhergesagt ist gleich, und die alternative Hypothese ist, dass die beobachteten Zahlen verschieden von dem erwarteten sind. Die Nullhypothese ist in der Regel eine extrinsische Hypothese, wo man die erwarteten Verhältnisse kannte, bevor das Experiment zu tun. Beispiele schließen ein 1: 1-Geschlechtsverhältnis oder ein 1: 2: 1-Verhältnis in einer genetischen Kreuzung. Ein weiteres Beispiel wäre bei einer Fläche von Ufer suchen, die 59% der Fläche in Sand, 28% Schlamm und 13% Felsen bedeckt hatten; wenn Sie untersuchen, wurden, wo Möwen stehen mögen, Ihre Nullhypothese wäre, dass 59% der Seemöwen auf Sand stand, 28% auf Schlamm und 13% auf den Felsen.

In einigen Situationen haben Sie eine intrinsische Hypothese. Dies ist eine Nullhypothese, wo man die erwarteten Anteile berechnen, nachdem Sie das Experiment zu tun, aus den Daten einen Teil der Informationen verwendet wird. Das bekannteste Beispiel einer intrinsischen Hypothese ist die Hardy-Weinberg Proportionen der Populationsgenetik: wenn die Häufigkeit eines Allels in einer Population p ist und das andere Allel q. die Nullhypothese ist, dass Frequenzen der erwarteten drei Genotypen sind p 2. 2PQ. und q 2. Dies ist eine intrinsische Hypothese, da Sie p und q aus den Daten schätzen, nachdem Sie die Daten sammeln, können Sie nicht p und q vor dem Experiment vorhersage.

Wie die Testarbeiten

Im Gegensatz zu der genauen Prüfung der Güte der Anpassung. der Chi-Quadrat-Test berechnet nicht direkt die Wahrscheinlichkeit der beobachteten Ergebnisse oder etwas extremeren zu erhalten. Stattdessen wie fast alle statistischen Tests, der Chi-Quadrat-Test hat einen Zwischenschritt; es nutzt die Daten, die eine Teststatistik zu berechnen, der misst, wie weit die beobachteten Daten von der Null Erwartung sind. Sie verwenden dann eine mathematische Beziehung, in diesem Fall die Chi-Quadrat-Verteilung, die Wahrscheinlichkeit zu schätzen den Wert der Teststatistik zu erhalten.

Sie berechnen die Teststatistik durch eine beobachtete Zahl (O) unter, die erwartete Anzahl (E) subtrahiert wird, dann diese Differenz quadriert. Je größer die Abweichung von der Nullhypothese, je größer die Differenz zwischen den beobachteten und den erwarteten ist. die Differenzen quadriert macht sie alle positiv. Sie teilen dann jede Differenz von der erwarteten Zahl, und Sie können diese standardisierten Differenzen addieren. Die Teststatistik ist in etwa gleich dem Log-Likelihood-Verhältnis in der G -Test verwendet. Es wird üblicherweise eine „Chi-Quadrat“ Statistik genannt, obwohl dies etwas verwirrend ist, weil es nur ein von vielen Teststatistiken ist, die die theoretische Chi-Quadrat-Verteilung folgen. Die Gleichung ist

Chi 2 = Σ (O-E) 2 / E

Wie bei den meisten Teststatistiken, desto größer wird der Unterschied zwischen den beobachteten und erwarteten, desto größer ist die Teststatistik. Um ein Beispiel zu geben, lassen Sie uns sagen, dass Ihre Nullhypothese ist ein 3: 1-Verhältnis von glatten Flügel zu faltig Flügel in Nachkommen aus einem Bündel von Drosophila kreuzt. Sie beobachten 770 Fliegen mit glatten Flügeln und 230 Fliegen mit faltigen Flügeln; die erwarteten Werte sind 750 glatt geflügelte und 250 faltig Flügel fliegen. Eingabe dieser Zahlen in die Gleichung ist der chi-Quadrat-Wert 2,13. Wenn Sie 760 glatt geflügelte Fliegen beobachtet hatten und 240 faltig-Flügel Fliege, die näher an die Nullhypothese ist, Ihr Chi-Quadrat-Wert gewesen wäre kleiner, bei 0,53; wenn Sie 800 glatt geflügelten beobachtet hatte und 200 faltig-Flügel Fliegen, die weiter von der Nullhypothese ist, Ihr Chi-Quadrat-Wert würde 13.33 gewesen.

Die Verteilung der Teststatistik unter der Nullhypothese ist ungefähr die gleiche wie die theoretische Chi-Quadrat-Verteilung. Dies bedeutet, dass, sobald Sie den Chi-Quadrat-Wert und die Anzahl der Freiheitsgrade kennen, können Sie die Wahrscheinlichkeit, dass Wert von Chi-Quadrat-Berechnung können die Chi-Quadrat-Verteilung verwenden. Die Anzahl der Freiheitsgrade ist die Anzahl der Kategorien minus eins, so für unser Beispiel gibt es einen Freiheitsgrad. Mit Hilfe der CHIDIST Funktion in einer Tabelle, die Sie eingeben = CHIDIST (2,13, 1) und berechnet, dass die Wahrscheinlichkeit, einen Chi-Quadrat-Wertes von 2,13 mit einem Freiheitsgrad des Erhaltens ist P = 0,144.

Die Form der Chi-Quadrat-Verteilung hängt von der Anzahl der Freiheitsgrade. Für eine extrinsische Nullhypothese (die viel häufiger Situation, wo man die Proportionen wissen von der Nullhypothese vorhergesagt, bevor die Datenerfassung), ist die Anzahl der Freiheitsgrade einfach die Anzahl der Werte der Variablen, minus eins. Wenn Sie also eine Nullhypothese eines 1 Prüfung sind: 1 Geschlechterverhältnis, gibt es zwei mögliche Werte (männlich und weiblich), und damit einen Freiheitsgrad. Dies liegt daran, wenn Sie wissen, wie viele der insgesamt sind Frauen (eine Zahl, die „frei“ variieren von 0 bis zur Stichprobengröße), die Anzahl von Männern bestimmt wird. Wenn es drei Werte der Variablen (wie rot, pink und weiß) sind, gibt es zwei Freiheitsgrade, und so weiter.

Post-hoc-Test

Wenn es mehr als zwei Kategorien sind und Sie wollen herausfinden, welche davon von ihrer Null Erwartung deutlich unterschiedlich sind, können Sie die gleiche Methode verwenden, um jede Kategorie gegen die Summe aller anderen Klassen zu testen, mit der Bonferroni-Korrektur, wie ich beschreiben für die genaue Prüfung. Sie verwenden Chi-Quadrat-Tests für jede Kategorie, natürlich.

Annahmen

Das Chi-Quadrat der Güte der Anpassung übernimmt Unabhängigkeit. wie für den Exact-Test beschrieben.

Beispiele: extrinsische Hypothese

Chi-Quadrat-Test der Güte der Anpassung - Handbook of Biological Statistik

Männlich rot Kreuzschnäbel, Loxia curvirostra. zeigt die beiden Arten Rechnung.

Berechnen der erwarteten Häufigkeit der rechten berechneter Vögel durch die gesamte Probengrße Multiplizieren (3647) durch den erwarteten Anteil (0,5) 1823,5 zu ergeben. Machen Sie dasselbe für links-berechnete Vögel. Die Anzahl der Freiheitsgrade, wenn ein für eine extrinsische Hypothese ist, die Anzahl der Klassen minus eins. In diesem Fall gibt es zwei Klassen (rechts und links), so gibt es einen Freiheitsgrad.

Das Ergebnis ist, Chi-Quadrat = 5,61, 1 D.F. P = 0,018, was darauf hinweist, dass Sie die Nullhypothese ablehnen kann; gibt es deutlich mehr links-berechnete Kreuzschnäbel als rechts in Rechnung gestellt.

Mannan und Meslow (1984) untersuchten das Verhalten Vogel Nahrungssuche in einem Wald in Oregon. In einem bewirtschafteten Wald, 54% des Baldachins Volumen betrug Douglasie, 40% war Ponderosa-Kiefer, 5% war der Riesentanne und 1% war West Lärche. Sie machten 156 Beobachtungen von Nahrungssuche durch rotbrüstiger nuthatches; 70 Beobachtungen (45% der Gesamtmenge) in Douglasie, 79 (51%) in Ponderosa-Kiefer, 3 (2%) in grand fir und 4 (3%) in West Lärche. Die biologische Nullhypothese ist, dass die Vögel zufällig Futter, ohne Rücksicht auf welche Baumart sie sind in; die statistische Nullhypothese ist, dass die Anteile von Nahrungssuche Ereignisse zu den Anteilen der Baldachin Volumen gleich sind. Der Unterschied in den Proportionen ist signifikant (Chi-Quadrat = 13,59, D.F. 3 P = 0,0035).

Die erwarteten Zahlen in diesem Beispiel sind ziemlich klein, so wäre es besser, es mit einer genauen Prüfung zu analysieren. Ich verlasse es hier, weil es ein gutes Beispiel für eine extrinsische Hypothese ist, die aus der Messung etwas (Baldachin Volumen, in diesem Fall), nicht eine mathematische Theorie kommt; Ich habe eine harte Zeit zu finden gute Beispiele dafür hatte.

Beispiel: intrinsische Hypothese

McDonald's (1989) untersuchte Variation am MPI-Locus in der Platorchestia platensis amphipod Krustentier von einem einzigen Standort auf Long Island, New York gesammelt. Es gab zwei Allele, MPi 90 und MPi 100 und die Genotyp-Frequenzen in Proben aus mehreren Terminen zusammen gepoolt 1203 Mpi 90/90. 2919 Mpi 90/100. und 1678 Mpi 100/100. Die Schätzung des MPI 90 Allels Anteils aus dem Datum 5325/11600 = 0,459. Mit Hilfe der Hardy-Weinberg-Formel und diese geschätzte Allel Verhältnis, sind die erwarteten Genotyp Anteile 0.211 Mpi 90/90. 0.497 Mpi 90/100. und 0.293 Mpi 100/100. Es gibt drei Kategorien (die drei Genotypen) und einen Parameter aus den Daten geschätzt (das MPI 90 Allels Anteil), so gibt es einen Freiheitsgrad. Das Ergebnis ist, Chi-Quadrat = 1,08, 1 D.F. P = 0,299, die nicht signifikant ist. Sie können nicht die Nullhypothese verwerfen, dass die Daten die erwarteten Hardy-Weinberg-Proportionen passen.

Graphische Darstellung der Ergebnisse

Mit mehr als zwei Werten der Sollgröße, sollten Sie in der Regel präsentieren die Ergebnisse eines Güte-of-Fit-Tests in einer Tabelle der beobachteten und erwarteten Proportionen. Wenn die erwarteten Werte liegen auf der Hand (wie zB 50%) oder leicht aus den Daten berechnet (wie Hardy-Weinberg-Anteile), können Sie die erwarteten Zahlen aus Ihrer Tabelle weglassen. Für eine Präsentation werden Sie wahrscheinlich wollen ein Diagramm, welches sowohl die beobachteten und erwarteten Proportionen, einen visuellen Eindruck davon zu geben, wie weit sie voneinander entfernt sind. Sie sollten ein Balkendiagramm für die beobachteten Proportionen verwenden; die erwarteten kann mit einer horizontalen gestrichelten Linie gezeigt wird, oder mit Stäben von einem anderen Muster.

Wenn Sie Fehlerbalken in die Grafik hinzufügen möchten, sollten Sie Konfidenzintervall für einen Teil verwenden. Beachten Sie, dass die Vertrauensintervalle nicht symmetrisch sein, und dies wird besonders deutlich, wenn der Anteil in der Nähe von 0 oder 1 ist.

Habitatnutzung im roten kleiber .. Graue Balken sind beobachteten Prozentsätze von Ereignissen in den einzelnen Baumarten, mit 95% Konfidenzintervall Nahrungssuche; schwarze Balken sind die erwarteten Prozentsatz.

Einige Leute benutzen eine „gestapelte Balkendiagramm“ Proportionen zu zeigen, vor allem, wenn es mehr als zwei Kategorien. Allerdings kann es schwierig machen, die Größen der beobachteten und erwarteten Werte für die mittleren Kategorien zu vergleichen, da beide ihre Hochs und Tiefs auf verschiedenen Ebenen sind, so dass ich es nicht empfehlen.

ähnliche Tests

Sie verwenden den Chi-Quadrat-Test der Unabhängigkeit für zwei Nenngrößen, nicht ein.

Es gibt mehrere Tests, die Chi-Quadrat-Statistik verwenden. Die hier beschriebenen wird als Pearson-Chi-Quadrat offiziell bekannt. Es ist bei weitem des häufigste Chi-Quadrat-Test, so ist es in der Regel nur den Chi-Quadrat-Test genannt.

Sie haben die Wahl zwischen drei Güte der Anpassung Tests: die genaue Prüfung der Güte der Anpassung, die G -test der Güte der Anpassung ,. oder der Chi-Quadrat-Test der Güte der Anpassung. Für kleine Werte der erwarteten Zahlen ist die Chi-Quadrat-und G -Tests ungenau, da die Verteilungen der Teststatistiken nicht die Chi-Quadrat-Verteilung sehr gut passen.

Die übliche Faustregel, dass Sie die genaue Prüfung verwendet werden sollen, wenn der kleinste zu erwartenden Wert kleiner als 5 ist, und das Chi-Quadrat-und G -Tests ist genau genug, um für eine größere Erwartungswerte. Diese Faustregel gilt: stammt aus den alten Tagen, wenn die Menschen von Hand statistische Berechnungen zu tun hatten, und die Berechnungen für die genaue Prüfung war sehr mühsam und wenn irgend möglich vermieden werden. Heutzutage machen Computer es genauso einfach, die genaue Prüfung als die rechnerisch einfacher Chi-Quadrat oder G -test zu tun, es sei denn, die Stichprobengröße so groß ist, dass auch Computer nicht damit umgehen können. Ich empfehle Ihnen, den genauen Test verwenden, wenn die gesamte Stichprobengröße kleiner als 1000. Bei Stichprobengrößen zwischen 50 und 1000 und den erwarteten Werten, die größer als 5 ist, es in der Regel nicht einen großen Unterschied machen, die Sie testen, so dass Sie shouldn‘ t jemand kritisiert für die Chi-Quadrat-oder G-Test für Experimente mit denen ich den genauen Test empfehlen. Finden Sie in der Web-Seite auf kleine Probengrößen für die weitere Diskussion.

Chi-Quadrat gegen G -test

Natürlich sollten Sie nicht Ihre Daten sowohl mit dem G-Test und dem Chi-Quadrat-Test analysieren, dann wählen Sie je nachdem, was Ihnen das interessanteste Ergebnis gibt; das wäre Betrug. Jedes Mal, wenn Sie versuchen, mehr als eine statistische Methode und verwenden nur die eine, die den niedrigsten P-Wert geben, sind Sie die Chance auf einen falsch positiven zu erhöhen.

Wie um den Test zu tun

Kalkulationstabelle

Ich habe eine Tabelle für den Chi-Quadrat-Test der Güte der Anpassung eingestellt. Es ist weitgehend selbsterklärend. Es wird die Freiheitsgrade für Sie berechnen, wenn Sie eine extrinsische Nullhypothese verwenden; wenn Sie eine intrinsische Hypothese verwenden, müssen Sie die Freiheitsgrade in die Tabelle ein.

Es gibt Webseiten, die den Chi-Quadrat-Test hier und hier werden zuführen. Keine dieser Web-Seiten können Sie die Freiheitsgrade auf den entsprechenden Wert für die Prüfung einer intrinsischen Nullhypothese gesetzt.

Hier ist ein SAS-Programm, die PROC FREQ für einen Chi-Quadrat-Test verwendet. Es nutzt die Mendel Erbsen-Daten von oben. Die „WEIGHT count“ sagt SAS, dass die „count“ Variable ist die Anzahl, wie oft jeder Wert von „Textur“ beobachtet wurde. Die ZEROS Option teilt es Beobachtungen mit Zählungen von Null zu zählen, zum Beispiel, wenn Sie 20 glatte Erbsen haben und 0 faltig Erbsen; es tut nicht weh, immer die ZEROS Option. Chisq sagt SAS einen Chi-Quadrat-Test zu tun, und TESTP = (75 25); erzählt es die erwarteten Prozentsatz. Die erwarteten Prozentsatz müssen bis zu 100 addieren Sie müssen den erwarteten Prozentsatz in alphabetischer Reihenfolge geben: weil „glatt“ kommt vor „zerknittert“, um die erwarteten Frequenzen für 75% glatt geben, 25% faltig.

Hier ist ein SAS-Programm, die PROC FREQ für einen Chi-Quadrat-Test auf Rohdaten verwendet, wo man jede einzelne Beobachtung aufgelistet hat, anstatt sie zu Zählen selbst. Ich habe drei Punkte verwendet, um anzuzeigen, dass ich nicht die komplette Datensatz gezeigt habe.

Die Ausgabe beinhaltet:

Sie würden dies als Bericht "Chi-Quadrat = 0,3453, 1 d.f. P = 0,5568."

Um eine Leistungsanalyse machen die G * Power-Programm verwenden, wählen Sie „Güte-of-fit-Tests: Kontingenztafeln“ aus dem Menü Statistische Tests, dann wählen Sie „Chi-Quadrat-Tests“ aus dem Test-Familie-Menü. Um Effektgröße zu berechnen, klicken Sie auf die Schaltfläche fest, und die Nullhypothese Proportionen in der ersten Spalte eingeben und die Proportionen Sie hoffen, in der zweiten Spalte zu sehen. Dann klicken Sie auf die Berechnung und Transfer zum Hauptfenster-Taste. Legen Sie Ihre Alpha und Macht, und sicher sein, die Freiheitsgrade (df) einzustellen; für eine extrinsische Nullhypothese, die Anzahl der Zeilen minus eins das wird.

Als Beispiel lassen Sie uns sagen, dass Sie eine genetische Kreuzung aus Löwenmäulchen mit einem erwarteten 1 zu tun: 2: 1-Verhältnis, und Sie wollen in der Lage sein, ein Muster mit 5% mehr Heterozygoten zu erkennen, die zu erwarten. Geben Sie 0,25, 0,50 und 0,25 in der ersten Spalte geben 0,225, 0,55 und 0,225 in der zweiten Spalte, klicken Sie berechnen und Transfer zum Hauptfenster einzugeben 0,05 für alpha, 0,80 für Strom, und 2 für die Freiheitsgrade. Wenn Sie dies richtig gemacht haben, soll Ihr Ergebnis eine Gesamtstichprobengröße von 964 sein.

Referenzen

Mannan, R. W. und E. C. Meslow. 1984 Vogelpopulationen und Vegetationseigenschaften in verwalteten und Altwäldern, im Nordosten Oregon. Journal of Wildlife Management 48: 1219-1238.

McDonald, J. H. 1989. Selection Komponentenanalyse des MPI-Locus in der amphipod Platorchestia platensis. Erblichkeit 62: 243-249.

In Verbindung stehende Artikel