Zum Inhalt springen
Kategorien: Data & KI

CRISP-DM

Was ist CRISP-DM? Definition

CRISP-DM steht für Cross Industry Standard Process for Data Mining und beschreibt ein standardisiertes und branchenübergreifendes Vorgehensmodell für Data-Mining- und Data-Science-Projekte. Es teilt sich in sechs Phasen – vom Finden der Geschäftsfrage bis zur praktischen Umsetzung der Analyseergebnisse.

Die sechs Phasen von CRISP-DM

Das Modell gliedert sich in folgende Prozessschritte:

  1. Business Understanding (Aufgabendefinition)
    Zieldefinition aus Unternehmenssicht: Welche Frage soll beantwortet werden? Was ist der geschäftliche Nutzen?
  2. Data Understanding (Auswahl der Daten)
    Sammlung, Sichtung und erste Analyse der verfügbaren Daten: Was liegt vor? Welche Datenqualität ist gegeben?
  3. Data Preparation (Datenaufbereitung)
    Aufbereitung der Daten für die Analyse: Bereinigung, Transformation, Merkmalsauswahl. In der Praxis oft der aufwändigste Schritt.
  4. Modeling (Machine Learning)
    Auswahl und Anwendung geeigneter Analyse- oder Machine-Learning-Modelle, z. B. Entscheidungsbäume oder Clusterverfahren.
  5. Evaluation (Bewertung und Interpretation der Ergebnisse)
    Bewertung der Modell-Ergebnisse im Hinblick auf die ursprüngliche Geschäftsfrage – nicht nur statistisch, sondern auch fachlich.
  6. Deployment (Anwendung der Ergebnisse)
    Umsetzung der Erkenntnisse in die Praxis – etwa als Dashboard, automatisierte Entscheidungshilfe oder operative Maßnahme.
Wichtig: Die Phasen sind nicht starr sequenziell zu durchlaufen. Rücksprünge und Iterationen gehören explizit dazu.

Vor- und Nachteile von CRISP-DM

Vorteile Nachteile
Strukturierter, nachvollziehbarer Prozess Keine offizielle Weiterentwicklung seit 2007
Tool- und branchenunabhängig einsetzbar Nicht auf Echtzeit- oder Streaming-Daten ausgelegt. Für klassische Batch-Prozesse geeignet,

bei Echtzeitanalysen ist eine Ergänzung durch agile oder DevOps-Frameworks sinnvoll

Hohe Verständlichkeit für gemischte Projektteams In agilen Projekten ggf. zu formal oder starr
Betonung des fachlichen Kontexts Deployment-Phase bleibt unspezifisch für moderne ML-Umgebungen

 

Relevanz für Unternehmen

CRISP-DM schafft Klarheit und Struktur in datengetriebenen Projekten – insbesondere dann, wenn Fachabteilungen, Datenexpert:innen und IT zusammenarbeiten. Es hilft dabei, Analyseprojekte methodisch sauber aufzusetzen, typische Fehler zu vermeiden und Ergebnisse praxisnah umzusetzen. Gerade für Unternehmen, die erste Schritte mit Data Science gehen oder standardisierte Abläufe etablieren wollen, bietet CRISP-DM eine gute Orientierung.

Praxisbeispiel

Ein Versicherungsunternehmen möchte kündigungsgefährdete Kund:innen frühzeitig erkennen und durchläuft hierzu in einem Datenprojekt die sechs Phasen des CRISP-DM.

  1. Business Understanding: Die Aufgabe bzw. das Ziel wird definiert: Kündigungen reduzieren, indem gefährdete Verträge erkannt werden.
  2. Data Understanding: Die Daten beinhalten Vertragslaufzeiten, Schadensfälle, Kontaktverhalten und Nutzungsmuster.
  3. Data Preparation: Fehlende Werte werden ergänzt, neue (abgeleitete) Merkmale wie „Kontaktfrequenz“ gebildet, Ausreißer behandelt.
  4. Modeling: Ein Entscheidungsbaum-Modell wird trainiert, um Risikokund:innen zu klassifizieren.
  5. Evaluation: Das eingesetzte Modell hat gute Metriken. Die Ergebnisse werden deshalb gemeinsam mit der Fachabteilung validiert und fließen in die nächste Iteration ein.
  6. Deployment: Die Modell-Ergebnisse werden in das CRM-System eingespeist. Vertriebsteams erhalten daraufhin automatisierte Hinweise zur Kundenansprache.

 

Mit Daten und KI die Zukunft gestalten

Ob Grundlagen oder Deep Dive – entwickle deine Skills im Bereich “Data Analytics und Künstliche Intelligenz” gezielt weiter und mach dich fit für die datengetriebene Arbeitswelt.


Jetzt entdecken

FAQ

Ist CRISP-DM noch aktuell?

Ja. Zwar wurde das Modell seit 2007 nicht offiziell weiterentwickelt, es ist aber weiterhin weit verbreitet und praxisbewährt – gerade im Mittelstand und in klassischen Analyseprojekten.

Eignet sich CRISP-DM auch für moderne Data-Science-Projekte?

Grundsätzlich ja. Für kontinuierliche Modellpflege, MLOps oder agile Produktentwicklung ist aber eine Ergänzung durch aktuellere Frameworks sinnvoll.

Wie flexibel ist das Modell?

Sehr flexibel in der Anwendung. Die sechs Phasen sind logisch aufgebaut, aber iterativ gedacht – Rücksprünge oder Parallelbearbeitungen sind ausdrücklich vorgesehen.

Gibt es unterstützende Tools oder Vorlagen?

Viele Unternehmen nutzen eigene Checklisten oder Vorlagen auf Basis von CRISP-DM. Auch Tools wie IBM SPSS Modeler oder KNIME orientieren sich stark am Phasenmodell.

Zum Glossar «