Erhalten Sie hier einen Einstieg in die Welt der Datenwissenschaft.
Machen Sie sich selbst ein Bild davon, was Data Science beinhaltet und welche Potenziale sie in Unternehmen und Organisationen entfalten kann!
Theoriephase
Business Problem & KI-Anwendungsfall
Der Ausgangspunkt eines jeden Data-Science-Projektes ist immer ein reales Business-Problem. Für die erfolgreiche Umsetzung von Data Science Projekten in Unternehmen ist es wichtig, dass der unternehmerische Mehrwert solcher Projekte in den Vordergrund gerückt wird.
Sie übersetzen ihr Business-Problem dafür in einen konkreten KI-Anwendungsfall. Das heißt, Sie überlegen sich, wie Sie Ihr Business-Problem durch die Analyse von Daten und die Anwendung von Machine-Learning lösen können. Dabei werden drei Formen des Machine Leraning unterschieden.
Datensammlung & Datenintegration
Machine-Learning-Algorithmen brauchen in der Regel eine große Menge an Daten von guter Qualität. Doch wo finden Sie Daten in Ihrem Unternehmen? Wie können Sie diese Daten mit externen Daten ergänzen? Und welche Rolle spielt die Data Privacy? In dieser Lerneinheit beschäftigen Sie sich mit einer gut durchdachten Datensammlungsstrategie.
Wenn Daten in verschiedenen Systemen gesammelt und gespeichert werden, müssen sie zunächst harmonisiert und vereinheitlicht werden. Dies ist das Ziel der Datenintegration. Die Datenintegration kann sehr anspruchsvoll sein, da unterschiedliche Datenquellen durchaus heterogen sein können, sowohl was den Inhalt als auch das Format der Datenquellen betrifft. Außerdem gibt es verschiedene Strategien für die Datenintegration.
Anwendungsphase in KNIME
Einführung in KNIME, Datenimport & Datenintegration
Sie erhalten eine erste Einführung in KNIME und die KNIME-Benutzeroberfläche. Sie installieren die Anwendung und richten sie ein. Anschließend lernen Sie Daten aus verschiedenen Quellen in KNIME zu importieren.
Zu Beginn eines Datenprojektes ist es häufig nötig, Daten aus verschiedenen Quellen in einem Datensatz zusammenzufassen. Sie lernen verschiedene Methoden kennen, um Daten aus verschiedenen Quellen in KNIME zu verknüpfen.
Dokumentation & Workflow Organisation
Für Data Science-Projekte, die über einen längeren Zeitraum laufen oder von verschiedenen Personen betreut werden, ist es wichtig, dass Sie Ihren Workflow in KNIME nachvollziehbar gestalten. Sie lernen Verfahren zu Dokumentation und Workflow-Organisation in KNIME kennen.
Im ersten inhaltlichen Webinar blicken wir gemeinsam auf die Inhalte der vergangenen Selbstlernphasen zurück. Schwerpunkt des Webinars wird die Beantwortung der Fragen der Lernenden sein.
Theoriephase
Datenvorbereitung & Datenbereinigung
Bevor die gesammelten und integrierten Daten nun weiter genutzt werden können, müssen sie auf etwaige Probleme überprüft werden, und diese Probleme müssen auch gelöst werden. Hier erfahren Sie mehr über Strategien und Maßnahmen, um Datensätze von fehlenden oder fehlerhaften Werten zu befreien.
Datenvisualisierung & Datenanalyse
Sobald ein bereinigter Datensatz vorliegt, folgt üblicherweise eine erste Untersuchung der Daten mit Visualisierungen und Parameterberechnungen. Diese ersten Analysen sind eine wichtige Grundlage für die Entscheidung, welche Eigenschaften im Datensatz vertieft untersucht werden sollen.
Anwendungsphase in KNIME
Datenvisualisierung und -analyse
Hier erfahren Sie alles über die verschiedenen Funktionen zur Visualisierung und deskriptiven Analyse Ihrer Daten in KNIME.
Datenbereinigung
Welche Datentypen gibt es in KNIME? Welche Funktionen bietet KNIME, um mit fehlenden oder falschen Datenwerten umzugehen? In dieser Lerneinheit beschäftigen wir uns praxisnah mit der Datenbereinigung.
Weiterführende Datentransformation
In Data Science-Projekten ist es manchmal nötig, Daten zu transformieren, um sie sinnvoll weiterverwenden zu können. Dazu gehört beispielsweise die Umformung oder die Neuberechnung von Variablen.
Wiederholungssaufgabe
In einer ersten umfassenden Wiederholungsaufgabe prüfen Sie Ihr bisher erworbenes Wissen. Anhand eines zur Verfügung gestellten Datensatzes durchlaufen Sie alle bislang behandelten Schritte eines Data Science Projektes selbstständig mit KNIME: Sie überlegen sich, welches Business Problem vorliegt und welchem KI-Anwendungsfall dieses entspricht. Anschließend importieren und bereinigen Sie die Daten in KNIME und führen eine erste explorative Datenanalyse und -visualisierung selbstständig durch.
Im zweiten Webinar widmen wir uns vor allem der Wiederholungsaufgabe. Ein möglicher Lösungsweg wird vorgestellt. Natürlich besteht auch hier wieder ausreichend Möglichkeit, Ihre Fragen zu stellen.
Grundlagen
Auswahl der Eigenschaften
In dieser Lerneinheit geht es um die Auswahl an Eigenschaften, also Variablen, die Sie verwenden wollen, um einen Machine-Learning-Algorithmus zu trainieren. Dabei gibt es grundsätzlich unterschiedliche Herangehensweisen, deren Vor- und Nachteile Sie unbedingt kennen sollten.
Algorithmus- und Methodikauswahl
In dieser Lerneinheit wiederholen Sie kurz die verschiedenen Arten des maschinellen Lernens. Anschließend schauen Sie sich für jede dieser Methoden viele unterschiedliche Algorithmen sowie deren Vor- und Nachteile an.
Ergebnisbeurteilung
Sobald die Ergebnisse eines maschinellen Trainingsvorgangs vorliegen, muss der Anwender entscheiden, ob das Ergebnis des Trainingsvorgangs für den gewünschten Einsatzzweck geeignet ist. Zentral ist hier vor allem die Frage, ob das Ergebnis uns helfen kann, unser Business Problem zu lösen und damit unsere Business-Ziele zu erreichen. In der Praxis ist die Beurteilungskompetenz für maschinelle Modelle von zentraler Wichtigkeit. Selbst wenn Sie die Analyse als Service zugekauft haben, liegt die Beurteilung der Güte und die Entscheidung über die weitere Verwendung des trainierten Modells bei Ihnen als zukünftiger:m Nutzer:in.
Anwendungsphase in KNIME
Machine Learning
Nun steigen Sie immer tiefer ein. In dieser Lerneinheit lernen Sie die verschiedenen Möglichkeiten des maschinellen Lernens in KNIME kennen. Neben dem Training eines maschinellen Modells geht es auch darum, die Güte eines solchen Modells in KNIME beurteilen zu können.
Das dritte Webinar nutzen wir noch einmal für einen theoretischen Deep Dive. Wir wiederholen die wichtigsten Formen des maschinellen Lernens und setzen einen besonderen Fokus auf die Ergebnisbeurteilung, die in Ihrem Arbeitsalltag zukünftig eine große Rolle spielen wird.
Theoriephase
Deployment, Überwachung & Fehlersuche
Nach der erfolgreichen Entwicklung eines Machine-Learning-Modells muss dieses schlussendlich auch Anwendung finden. Deshalb geht es in dieser Lerneinheit um die Verteilung des Modells, um das Monitoring, die Fehlerbehebung und die Weiterentwicklung.
Anwendungsphase in KNIME
Datenexport & Deployment
Die verschiedenen Möglichkeiten des Deployments und Datenexports in KNIME werden vorgestellt. Dazu gehört der Export von Daten in Datenbanken, das automatisierte erstellen und Versenden von Berichten und das automatisierte Ausführen von KNIME-Workflows. Zum Abschluss eines Data Science-Projektes werden Sie Ihre Daten häufig aus KNIME exportieren und in anderen Anwendungen weiterverwenden. Dazu stehen Ihnen einen Reihe an Export-Nodes zur Verfügung. Diese werden hier erläutert.
Wiederholungsungsaufgabe
Zum Abschluss bearbeiten Sie erneut eine Wiederholungsaufgabe anhand eines realistischen Datensatzes. Dieses Mal bearbeiten Sie alle Schritte eines Data Science-Projektes. Einen besonderen Fokus legen wir hier auf die Bewertung des von Ihnen trainierten maschinellen Modells.
Im vierten Webinar widmen wir uns der zweiten Wiederholungsaufgabe. Neben möglichen Rückfragen zur Übungsaufgabe können auch Fragen zur freiwilligen Abschlussprüfung gestellt werden.
Vermittlung der Inhalte über digitale Bestandteile wie z.B. E-Learnings, interaktive Übungen, Webinare, Lernkontrollen und mehr. Austausch mit Lerner:innen und Expert:innen über eine Community. Ortsungebunden und jederzeit abrufbar. Mobil lernen, wann und wo Sie möchten!
Personen, die die Potenziale Ihrer Unternehmensdaten erkennen und damit einhergehende Innovationen vorantreiben und nutzen möchten. Alle, die mehr zum Thema Data Science erfahren und ohne Coding Automatisierung und KI in Ihrem Business anwenden möchten.
Programmierkenntnisse sind nicht erforderlich! Grundlagenkenntnisse der Data Science werden vorausgesetzt.
Wir empfehlen, dass Sie vor dem Besuch dieser Weiterbildung das Online Essential: Smart Data Science (32549) oder das Präsenztraining Smart Data Science (30298) besuchen.