CHAID - Statistik-Lösungen

Merging: In CHAID Analyse, wenn die abhängige Variable kontinuierlich ist, wird der F-Test verwendet, und wenn die abhängige Variable kategorischer ist, wird der Chi-Quadrat-Test verwendet. Jedes Paar Prädiktor Kategorien werden bewertet, um zu bestimmen, was am wenigsten signifikant in Bezug auf die abhängige Variable unterscheidet. Aufgrund dieser Schritte des Mischens wird eine Bonferroni eingestellt p-Wert für die fusionierten Kreuztabellierung berechnet.

  1. Root-node: Wurzelknoten enthält das abhängige oder Zielvariable. Zum Beispiel ist CHAID sinnvoll, wenn eine Bank will die Kreditkarte Risiko basieren auf Informationen, wie Alter, Einkommen, Anzahl der Kreditkarten, etc. In diesem Beispiel Kreditkartenrisiko ist die Zielgröße und die übrigen Faktoren sind die Prädiktorvariablen vorherzusagen .
  2. Eltern Knoten: Der Algorithmus teilt die Zielvariable in zwei oder mehr Kategorien. Diese Kategorien werden übergeordnete Knoten oder Ausgangsknoten bezeichnet. Für die Bank beispielsweise hohe, mittlere und niedrige Kategorien sind die Knoten der Eltern.
  3. Kindknoten: Unabhängige Variable Kategorien, die in der CHAID Analysebaum unter der übergeordneten Kategorien kommen, werden die untergeordneten Knoten genannt.
  4. Endknoten: Die letzten Kategorien der CHAID Analysebaum sind die Endknoten genannt. In der CHAID Analysebaum, dass die Kategorie einen großen Einfluss auf die abhängige Variable ist an erster Stelle und die weniger wichtige Kategorie kommt zuletzt. Somit ist es der Endknoten bezeichnet.

Kostenlose Beratung

Fragen zu CHAID? Erfahren Sie mehr während der kostenlosen 30-minütige Beratung.

In Verbindung stehende Artikel