Eine Einführung in Data Mining
Eine Einführung in Data Mining
Die Entdeckung versteckt Wert in Data Warehouse
Die meisten Unternehmen bereits sammeln und massive Mengen von Daten verfeinern. Data-Mining-Techniken können schnell auf vorhandene Software- und Hardware-Plattformen implementiert werden, um den Wert der bestehenden Informationsressourcen zu verbessern, und können mit neuen Produkten und Systemen integriert werden, da sie online gebracht werden. Wenn auf Hochleistungs-Client / Server oder parallele Verarbeitung Computern implementiert, Data-Mining-Tools können massive Datenbanken analysieren Antworten auf Fragen zu, wie „Welche Kunden am ehesten zu meinem nächsten Werbe-Mailing reagieren zu können, und warum?“
Dieses Whitepaper bietet eine Einführung in die grundlegenden Techniken des Data Mining. Beispiele für profitable Anwendungen illustrieren ihre Relevanz für heute # 146; s Geschäftsumfeld sowie eine grundlegende Beschreibung, wie Data-Warehouse-Architekturen entwickeln können den Wert von Data Mining liefern an Endverbraucher.
Die Grundlagen des Data Mining
Data-Mining-Techniken sind das Ergebnis eines langen Prozesses der Forschung und Produktentwicklung. Diese Entwicklung begann, als Geschäftsdaten zunächst auf Computern gespeichert wurde, setzte sich mit Verbesserungen in den Datenzugriff, und in jüngerer Zeit entwickelte Technologien, die Benutzern ermöglichen, durch ihre Daten in Echtzeit zu navigieren. Data Mining nimmt diesen evolutionären Prozess über retrospektiven Datenzugriff und Navigation zu Interessenten und proaktive Informationsbereitstellung. Data Mining ist bereit für den Einsatz in der Wirtschaft, weil sie von drei Technologien unterstützt wird, die jetzt reif genug:- Massives Datensammlung
- Leistungsstarke Computer mit mehreren Prozessoren
- Data-Mining-Algorithmen
In der Entwicklung von Geschäftsdaten zu Geschäftsinformationen, jeder neuer Schritt wird auf dem vorherigen gebaut. Zum Beispiel ist dynamischer Datenzugriff entscheidend für Drillthrough- in Datennavigationsanwendungen, und die Fähigkeit, große Datenbanken zu speichern, ist entscheidend für Data Mining. Vom Benutzer # 146; s Sicht aufgelistet die vier Schritte in Tabelle 1 waren revolutionär, weil sie neue Geschäft Fragen erlaubten präzise und schnell beantwortet werden.
Prospektive, proaktive Information Lieferung
Tabelle 1. Schritte in der Entwicklung des Data Mining.
Der Umfang von Data Mining
Data-Mining-Techniken können die Vorteile der Automatisierung ergeben auf bestehende Software und Hardware-Plattformen und können auf neue Systeme implementiert werden, wie bestehende Plattformen aktualisiert werden und neue Produkte entwickelt. Wenn Data-Mining-Tools auf Hochleistungs-Parallelverarbeitungssystemen implementiert werden, können sie riesige Datenbanken in wenigen Minuten analysieren. Schnellere Verarbeitung bedeutet, dass Benutzer automatisch mit mehr Modellen komplexe Daten zu verstehen, experimentieren können. Hohe Geschwindigkeit macht es praktisch für Anwender große Datenmengen zu analysieren. Größere Datenbanken, die wiederum die Ausbeute verbessert Vorhersagen.
Wie Data Mining Works
Wie genau ist Data Mining können Sie wichtige Dinge sagen, dass Sie nicht wissen, oder was wird als nächstes passieren? Die Technik, die verwendet wird, um diese Meisterleistungen in Data Mining durchzuführen, ist die Modellierung genannt. Modellierung ist einfach der Akt ein Modell in einer Situation Gebäude, in dem Sie die Antwort kennen und anwenden es dann zu einer anderen Situation, dass Sie dies nicht tun. falls sie eine versunkenen spanische Galeone auf hohen See das erste, was suchen Sie tun könnten, ist zum Beispiel, um die Zeiten zu erforschen, als spanischer Schatz war von anderen in der Vergangenheit gefunden worden. Sie könnten beachten Sie, dass diese Schiffe neigen oft dazu, vor der Küste von Bermuda gefunden ausgeschaltet werden und dass es bestimmte Merkmale auf die Meeresströmungen und bestimmte Routen, die durch das Schiff # genommen haben 146 wahrscheinlich worden; in dieser Zeit s Kapitäne. Sie können diese Ähnlichkeiten beachten und ein Modell erstellen, das die Eigenschaften enthält, die an den Orten dieser versunkenen Schätze gemeinsam sind. Mit diesen Modellen in der Hand segeln Sie die Suche nach Schatz, wo Ihr Modell zeigt es höchstwahrscheinlich eine ähnliche Situation in der Vergangenheit gegeben werden könnte. Hoffentlich, wenn Sie ein gutes Modell haben, finden Sie Ihren Schatz.
Tabelle 3 - Data Mining für Prognosen
Wenn jemand gesagt, dass er ein Modell hatte die Nutzung durch den Kunden vorhersagen konnte, wie würden Sie wissen, ob er wirklich ein gutes Modell hatte? Das erste, was Sie versuchen könnten, wäre, ihn zu fragen sein Modell auf Ihren Kundenstamm zu beantragen - wo Sie die Antwort bereits kannte. Mit Data Mining, der beste Weg, dies zu tun ist durch einige Ihrer Daten in einem Tresor beiseite es aus dem Mining-Prozess zu isolieren. Nachdem der Bergbau abgeschlossen ist, können die Ergebnisse gegen die im Tresor gespeicherten Daten getestet werden, um das Modell # 146, um zu bestätigen, Gültigkeit s. Wenn das Modell funktioniert, sollte seine Beobachtungen für die Gewölbe Daten halten.
Eine Architektur für Data Mining
Um am besten, diese fortgeschrittenen Techniken anwenden, müssen sie vollständig mit einem Data Warehouse sowie flexible interaktiven Business-Analyse-Tool integriert werden. Viele Data-Mining-Tools arbeiten derzeit außerhalb des Lagers, erfordern zusätzliche Schritte zum Extrahieren, Importieren und Analysieren der Daten. Wenn darüber hinaus neue Erkenntnisse operative Umsetzung erfordern, die Integration mit dem Lager vereinfacht die Anwendung der Ergebnisse von Data Mining. Die sich ergebende analytische Data Warehouse können Geschäftsprozesse im gesamten Unternehmen zu verbessern, in Bereichen wie Werbe-Kampagnen-Management, Betrugserkennung, neue Produkteinführung, und so weiter angewendet werden. 1 zeigt eine Architektur für erweiterte Analyse in einem großen Data-Warehouse.
Abbildung 1 - Integrated Data Mining Architektur
1 META Group Application Development Strategies: "Data Mining für Data Warehouse: Aufdecken versteckte Muster.", 7/13/95.
2 Gartner Group Advanced Technologies and Applications Research Note, 2/1/95.
3 Gartner Group High Performance Computing Research Note, 1/31/95.
Glossar der Begriffe Data Mining