Independence Testen mit Hilfe von Chi-Quadrat, Echt Statistik mit Excel

Das Verfahren in der Güte von Fit beschrieben ist, kann auch verwendet werden, um zu bestimmen, ob zwei Datensätze sind unabhängig voneinander. Solche Daten werden organisiert, was Kontingenztafeln genannt werden. wie in Beispiel 1 beschrieben, In diesen Fällen df = (Zeilenanzahl - 1) (Spaltenanzahl - 1).

Excel-Funktion. Die CHISQ.TEST Funktion in der Güte von Fit beschrieben kann erweitert werden, Bereiche, bestehend aus mehreren Zeilen und Spalten zu unterstützen. Für R1 die Anordnung der beobachteten Daten und R2 = die Anordnung von erwarteten Werten =, haben wir

CHISQ.TEST (R1, R2) = CHISQ.DIST (x, df) wobei x von R1 und R2 wie in Definition 2 der Güte der Anpassung und df = berechnet (Zeilenanzahl - 1) (Spaltenanzahl - 1).

Die Bereiche R1 und R2 müssen die gleiche Größe und Form haben und nur numerische Werte enthalten.

Independence Testen mit Hilfe von Chi-Quadrat, Echt Statistik mit Excel

Abbildung 1 - beobachteten Daten und die erwartete Wert für Beispiel 1

Wir setzen die Nullhypothese zu sein

H0. Auf höchstem Niveau erreicht Schulbildung ist unabhängig von Eltern Reichtum

Wir verwenden den Chi-Quadrat-Test, und so müssen die erwarteten Werte berechnen, die oben in der Tabelle zu den beobachteten Werten entsprechen. Um dies zu erreichen wir die Tatsache verwenden (nach Definition 3 von Grundwahrscheinlichkeitskonzepten), dass, wenn A und B unabhängige Ereignisse sind dann P (A ∩ B) = P (A) ∙ P (B). Wir gehen auch davon aus, dass die Anteile für die Probe sind gute Schätzungen für die Wahrscheinlichkeiten der erwarteten Werte.

Wir zeigen nun, wie die Tabelle von erwarteten Werten zu konstruieren (d.h. die erwarteten Werte in Abbildung 1). Wir wissen, dass 45 der 175 Personen in der Stichprobe sind von reichen Familien, und so ist die Wahrscheinlichkeit, dass jemand in der Probe aus einer reichen Familie ist 45/175 = 25,7%. Ähnlich ist die Wahrscheinlichkeit, dass jemand in der Probe von der Universität graduiert ist 68/175 = 38,9%. Aber basierend auf der Nullhypothese, das Ereignis aus einer reichen Familie des Seins ist unabhängig von dem Universitätsabschluss, und so die erwartete Wahrscheinlichkeit beiden Veranstaltungen ist einfach das Produkt der beiden Ereignisse, oder 25,7% ∙ 38,9% = 10,0%. Somit basiert auf der Nullhypothese, wir erwarten, dass 10,0% von 175 = 17,5 Menschen aus einer reichen Familie sind und von der Universität absolviert.

Auf diese Weise können wir die Tabelle für die erwarteten Werte ausfüllen. Wir beginnen mit dem in der Erwartungswerte-Tabelle all Summen Einstellung das gleiche sein wie die entsprechende Summe in der Tabelle beobachteten Werte (z.B. K6 Zelle die Formel = E6 enthält). Dann setzen wir den Wert jeder Zelle in der Tabelle Erwartete Werte zu sein

(Row Gesamt ∙ col gesamt) / Gesamtsumme

Z.B. Zelle H6 enthält die Formel = K6 * H9 / K9. Ein alternativer Ansatz für die in allen Zellen in der erwarteten Werten Tabelle Füllung ist die folgende Matrixformel im Bereich H6 zu platzieren: J8 (und dann die Taste Strg-Shft-Eingabe):

Siehe Matrix-Operationen für weitere Informationen über die MMULT Array-Funktion. Wir können nun den p-Wert für die Chi-Quadrat-Test-Statistik als CHITEST (Obs. Exp. Df) berechnen, wo Obs der 3 × 3-Array von beobachteten Werten liegt, = exp den 3 × 3-Array von erwarteten Werten und df = ( Zeilenanzahl - 1) (Spaltenanzahl - 1) = 2 ∙ 2 = 4. Da

CHITEST (B6: D8, H6: J8) = 0,003273 < .05 = α

Wir verwerfen die Nullhypothese und den Schluss, dass das Niveau der erreichten Schulbildung ist Reichtum nicht unabhängig von den Eltern.

Beispiel 2. Ein Forscher wissen möchte, ob es einen signifikanten Unterschied bei zwei Therapien für Patienten von Kokainabhängigkeit Härtung (definiert als nicht Kokain für mindestens 6 Monate dauern). Sie testet 150 Patienten und erhält die Ergebnisse in der oberen linken Teil der Tabelle unter (beobachteter Werte markiert).

Independence Testen mit Hilfe von Chi-Quadrat, Echt Statistik mit Excel

Abbildung 2 - Chi-Quadrat-Tests für die Unabhängigkeit

Wir stellen die folgende Nullhypothese:

H0. Es gibt keinen Unterschied zwischen der Fähigkeit der beiden Therapien Kokainabhängigkeit zu heilen

Wir berechnen neben den erwarteten Werten aus den beobachteten Werten und dann den p-Wert der Chi-Quadrat-Statistik, wie wir in Beispiel 1 Dieses Mal haben wir jedoch den Ansatz in Beispiel 2 der Anpassungsgüte eingesetzt verwenden. nämlich die Berechnung des Chi-Quadrat-Test-Statistik nach Pearson direkt (unter Verwendung Definition 2 der Güte der Anpassung). Der Wert dieser Statistik ist 5,516 (Zelle D17 in Abbildung 2). Da wir mit einer 2 × 2-Tabelle von Beobachtungen handeln, df = (2 - 1) (2 - 1) = 1. Schließlich beobachten wir, dass

p-Wert = CHIDIST (χ 2 df) = CHIDIST (5.516,1) = 0,0188 < .05 = α

χ 2 = -crit CHIINV (α, df) = CHIINV (.05,1) = 3,841 < 5.516 = χ 2 -obs

und so lehnen wir die Nullhypothese und schließen, dass es einen signifikanten Unterschied in der Heilungsrate zwischen den beiden Therapien.

Wie in Güte von Fit erwähnt. der Maximum-Likelihood-Test ist eine genauere Version des Chi-Quadrat-Tests bisher eingesetzt. Die rechte untere Seite der Arbeitsblatt in Figur 2 zeigt, wie die Maximum-Likelihood-Statistik berechnen (1 Definition der Güte der Anpassung verwendet wird). Der Wert dieser Statistik ist 5.725, die sich von der Teststatistik nicht viel anders ist, dass wir mit der Pearson-Test erhalten. Da diese Statistik auch mit einem Freiheitsgrad etwa Chi-Quadrat ist, ist die Analyse sehr ähnlich:

p-Wert = CHIDIST (χ 2 df) = CHIDIST (5.725,1) = .015 < .05 = α

χ 2 = -crit CHIINV (α, df) = CHIINV (.05,1) = 3,841 < 5.725 = χ 2 -obs

und so wieder, lehnen wir die Nullhypothese und schließen, dass es signifikante Unterschiede in den Ergebnissen für die beiden Therapien.

Überwachung. Es ist sehr wichtig, alle Beobachtungen im Test enthält. Z.B. wenn in Beispiel 2 wir nur gegen Therapie 1 und 2 gehärteten Test, werden wir fehlerhafte Ergebnisse erzielen. Wir müssen, um nicht auch geheilt als geheilt.

Real Statistiken Excel-Funktionen. Die folgenden zusätzlichen Funktionen sind in der Real Statistik Ressourcenpaket zur Verfügung gestellt:

CHI_STAT2 (R1, R2) = Pearson Chi-Quadrat-Statistik für die Beobachtungswerte im Bereich R1 und Erwartungswerte im Bereich R2

CHI_MAX2 (R1, R2) = Maximum Likelihood Chi-Quadrat-Statistik für die Beobachtungswerte im Bereich R1 und Erwartungswerte im Bereich R2

CHI_STAT (R1) = Pearson Chi-Quadrat-Statistik für Beobachtungswert in Bereich R1. Dies ist CHI_STAT2 (R1, R2), wobei R2 die Erwartungswerte von R1 berechnet.

CHI_MAX (R1) = Maximum Likelihood Chi-Quadrat-Statistik für die Beobachtungswerte im Bereich R1. Dies ist CHI_MAX2 (R1, R2), wobei R2 die Erwartungswerte von R1 berechnet.

CHI_TEST (R1) = p-Wert für Chi-Quadrat-Statistik für die Beobachtungswerte im Bereich R1 des Pearson. Dies ist CHITEST (R1, R2), wobei R2 die Erwartungswerte von R1 berechnet.

CHI_MAX_TEST (R1) = p-Wert für die maximale Likelihood-Chi-Quadrat-Statistik für die Beobachtungswerte im Bereich R1

Die Bereiche R1 und R2 müssen nur numerische Werte enthalten.

Echt Statistik Datenanalyse-Tool. Darüber hinaus bietet das Real Statistik Ressourcen Paket ein zusätzliches Chi-Quadrat-Test-Daten-Analyse-Tool. So verwenden Sie dieses Werkzeug für Beispiel 1 Ctrl-m eingeben und die Chi-Quadrat-Test-Option auswählen. Ein Dialogfenster, wie in Abbildung 3 erscheint.

Independence Testen mit Hilfe von Chi-Quadrat, Echt Statistik mit Excel

Abbildung 3 - Dialogfeld für Chi-Quadrat-Test

Setzen Sie die Beobachtungsdaten in den Eingangsbereich (ohne die Summen, aber die Zeilen- und Spaltenüberschriften, die gegebenenfalls, d.h. Bereich A5: D8), klicken Sie auf das Format Optionsfeld Excel und drücken Sie dann die OK-Taste. Lassen Sie die Fisher-Exakt-Test Option nicht aktiviert (siehe Fisher-Exakt-Test für die Verwendung dieser Option).

Das Datenanalyse-Tool baut einen Array mit den erwarteten Werten und führt sowohl die Pearson und Maximum-Likelihood-Chi-Quadrat-Tests. Die Wirkung Größe Cramer, und für 2 × 2 Kontingenztafeln der Odds Ratio Effektgröße, wie in Effect Größe für Chi-Quadrat beschrieben wird ebenfalls berechnet. Die Ausgabe von dem Datenanalysewerkzeug für die Daten in Beispiel 1 in 4 gezeigt.

Independence Testen mit Hilfe von Chi-Quadrat, Echt Statistik mit Excel

Abbildung 4 - Chi-Quadrat-Datenanalysewerkzeug Ausgang für Beispiel 1

Überwachung. Wie in Güte von Fit beschrieben. die erwartete Frequenz für jede Zelle in der Kontingenztabelle im allgemeinen mindestens 5 mit kleinen Tischen (insbesondere 2 × 2 Tabellen) sein sollte, die Zellen mit erwarteten Frequenzen von zumindest 10 vorzuziehen wären.

Überwachung. Zusätzlich zu dem üblichen Excel-Eingabedatenformat unterstützt das Echt Statistik Chi-Quadrat-Test-Daten-Analyse-Tool ein weiteres Eingabedatenformat Standardformat genannt. Dieses Format ist ähnlich dem von SPSS und anderen statistischen Analyseprogrammen verwendet.

Independence Testen mit Hilfe von Chi-Quadrat, Echt Statistik mit Excel

Abbildung 5 - Daten und Chi-Quadrat-Tests für das Beispiel 3

Wieder einmal eingeben Strg-m und wählen Sie das Chi-Quadrat-Daten-Analyse-Tool. Wenn das in Abbildung 3 gezeigte Dialogfeld angezeigt wird, legen A3: B41 in den Eingangsbereich. klicken Sie auf das Standardformat Radio-Button und drücken Sie die OK-Taste.

Das Datenanalyse-Tool baut zuerst eine Kontingenztabelle (Bereich D5: F8 von Figur 5) und führt die gleiche Art von Analyse wie für Beispiel 1 und 2. Da sig = keine (Zelle R11 oder R12) die Nullhypothese nicht verwerfen kann, die ein sein Studium Schüler unabhängig von seinen / ihren Eltern Höhe des Einkommens.

Simone,
Ohne weitere Informationen, kann ich nicht sicher sagen, aber Mann-Whitney ist für diese Art von Problemen verwendet.
Charles

Ich habe eine einfache Frage. Ich verwende die CHISQ.TEST Funktion für einen Chi-Quadrat-Test. Die Erklärung behauptet, dass die Funktion die Chi-Quadrat-Statistik und die Freiheitsgrade zurück. Aber der einzige Ausgang ich erhalte, ist der P-Wert.

Wie erhalte ich den Rest des Ausgangs? Oder, wie übersetze ich den P-Wert in einen Chi-Quadrat-Wert und Freiheitsgrade?

Mike,
CHISQ.TEST berechnet nur den p-Wert. Die Webseite sagt, dass CHISQ.TEST (R1, R2) = CHISQ.DIST (x, df) und die rechte Seite ist ein p-Wert.
Um die Chi-Quadrat-Statistik und Freiheitsgrade zu erhalten:
df = (Anzahl der Zeilen in R1 - 1) (Anzahl der Spalten in R1 - 1)
Chi-Quadrat-Statistik kann manuell berechnet werden, wie auf der Güte der Anpassung Webseite beschrieben oder durch die reale Statistikfunktion CHI_STAT2 Verwendung (R1, R2) oder CHI_STAT (R1).
Charles

rajesh bansal sagt:

In Verbindung stehende Artikel