Optimal Binning-Tool für Predictive Analytics - Alteryx Gemeinschaft
Ich hielt auf das Lesen und hier ist die bessere Lösung:
Betrachtet man die Monotonie und / oder Konvexität Fällen als unsere Zwänge wäre die ideale Praxis einen constarained Optimierungsalgorithmus für jede Variable ausgeführt werden. Dadurch für mehrere Variablen auf einmal wird der Schlüssel zu dem Werkzeug erzeugt werden.
Eine ähnliche Möglichkeit besteht in SAS Scoring-Tool, das scheint deshalb SAS-Tool vor allem von Finanzinstituten verwendet wird,
So, jetzt sicherlich glaube, dass ich es nicht viel Mühe, wird dies in der nächsten Version enthalten.
Es gibt einige Informationen verloren mit Binning Ich bin damit einverstanden.
Aber dann können die nicht-linearen Beziehungen zu erfassen. , die wir nicht mit kontinuierlichen Variablen in log reg tun.
Auch Dan, glauben Sie nicht, die Wechselwirkungen kann unter Berücksichtigung 2 Prädiktor Kombinationen in Bezug auf das Ziel (Binning mit CHAID) erfasst werden?
Offensichtlich im Hinblick auf der Interpretierbarkeit es ist auf jeden Fall eine harte Sache zu gehen und ein zufälliges Waldmodell zu einem Bankenaufsicht zu erklären.
Hier ist eine FICO ist die gleiche Experian Partituren Modelldokumentation, sie gezielt maßgeschneiderten Binning nach dem Auto-Binning zu beheben Vorurteile und Spiel buisiness Zwänge, so etwa. 1,2 Milliarden Menschen auf der ganzen Welt haben Kredite auf diese Weise erzielt. Und ein LGD-Modell Dokumentation von SAS auf einer ähnlichen Basis.
Neben den analytcal Vor-und Nachteile des Prozesses die meisten Banken und Versicherungen freuen uns für die optimale Binning oder visuelle Binning-Tools für ihre erweiterte Analyse-Anwendungen. Welche haben wir ausführlich in SAS und SPSS Stat. Durch die automatischen Vernachlässigen oder die Tatsache zurückgewiesen, dass es gemeinsame Nutzung in mehreren Branchen nicht denken Sie, dass in diesen Branchen Traktion gewinnen wird ein wenig härter sein?
Das ist ein guter Punkt. In meinem früheren Leben als Professor, war ich die Faktorenanalyse aus einem ähnlichen Grunde immer suspcious. Von einem Ökonometrie Hintergrund habe ich gezeigt, wie Faktorenanalyse zu falschen Ergebnissen in der Mitte der komplizierten endogenen Modellen führen würde.
Doch in der Praxis, finde ich mich oft Kompromisse machen zu müssen. Zum Beispiel meine Firma weiß absolut, dass einige unserer Engagement-Aktivitäten stark von einigen unserer Kunden geschätzt wird. Das „richtige“ Modell würde in der verschiedenen Gruppen von Kunden optimalen engagment Schwellenwerte identifizieren. Eine Kombination von Clustern und hierarchische Modelle könnten diese „richtige“ Modell aufzudecken. Aber wir haben zwei große Straßensperren zu entwirren so ein elegantes Modell: 1) Mangel an Beobachtungen (wir sind ein Unternehmen, B2B und haben nicht Tausende / Zehntausende von Beobachtungen solche algorithmischen Ansätze mit Vertrauen zu verwenden), und 2) uns haben verrauschten Signalen von Eingriffsdaten.
Putting, dass insgesamt, auch wenn ich ein ausgebildeter econometrician bin, ich mich in der Notwendigkeit eines solchen primitiven Werkzeugen als vereinfach optimale Binning Algorithmen finden. Mein Dissertation Berater in diesem Beitrag von mir zurückschrecken würde, ich wünschte, ich hätte ein kryptischer Benutzername verwendet!