Weiterbildung

Data Scientist mit Python

Data Pipelines mit Machine-Learning-Algorithmen und Python – das Online-Training mit Abschlusszertifikat

Daten automatisiert und in Echtzeit verarbeiten, analysieren und daraus Erkenntnisse ableiten zu können, gehört zu den zentralen Anforderungen von Unternehmen. Die Daten-Pipelines dafür aufzubauen, ist die Aufgabe von Data Scientists – ein Berufsfeld, das derzeit besonders gefragt ist und große Chancen bietet. Diese zertifizierte Online-Weiterbildung befähigt dich, Data-Mining-Prozesse aufzusetzen, Machine-Learning-Algorithmen anzuwenden, Prognosemodelle zu erstellen und diese in automatisierten Workflows produktiv zu setzen. Dabei wird die Programmiersprache Python mit ihren führenden Machine-Learning-Bibliotheken verwendet. Dieser Online-Kurs ist so konzipiert, dass du flexibel und in deinem eigenen Tempo lernen kannst. Es erwarten dich Videos, interaktive Grafiken, Texte und viele praktische Übungen mit umfangreichen Datensätzen und Coding-Aufgaben. Bei Fragen stehen dir erfahrene Datenanalyst:innen als Mentor:innen zur Seite.

Das Online-Training ist von der Staatlichen Zentralstelle für Fernunterricht (ZFU) in Köln unter der Nummer 73597 geprüft und zugelassen.

Inhalte

Weiterbildung nach KI-VO Art. 4 für die Nachweispflicht von KI-Kompetenz

1. Grundlagen Data Analytics mit Python

  • Arbeiten mit dem Data Lab.
  • Grundlagen und Konzepte in Python.
  • Vorstellung der Tools pandas, matplotlib und seaborn.
  • Datenbankanfragen mit SQL Alchemy.

2. Lineare Algebra

  • Mathematische Hintergründe.
  • Grundbegriffe der linearen Algebra.
  • Berechnung mit Vektoren und Matrizen.
  • Einsatz der Python-Bibliothek numpy.

3. Wahrscheinlichkeitsverteilung

  • Statistik in Data-Science-Algorithmen.
  • Diskrete und kontinuierliche Verteilungen.
  • Versionierung von Code in Git.

4. Überwachtes Lernen (Regression)

  • Lineare Regression einsetzen.
  • Einsatz des Python-Pakets sklearn.
  • Regressionsmodelle verstehen.
  • Evaluation der Prognosen.
  • Bias-Variance-Trade-Off und Regularisierung.
  • Messung der Modellgüte.

5. Überwachtes Lernen (Klassifikation)

  • Konzepte des Supervised Learning.
  • Einführung in Klassifikationsalgorithmen.
  • Der k-Nearest-Neighbors-Algorithmus.
  • Einschätzung der Klassifikationsperformance.
  • Optimierung der Parameter.
  • Aufteilung der Daten in Trainings- und Evaluationssets.

6. Unüberwachtes Lernen (Clustering)

  • Konzepte des Unsupervised Learning.
  • Der k-Means-Algorithmus.
  • Evaluation der Performance-Metriken.
  • Alternativen zum k-Means-Clustering.

7. Unüberwachtes Lernen (Dimensionsreduktion)

  • Dimensionen in der Datenbetrachtung reduzieren.
  • Principal Component Analysis (PCA).
  • Unkorrelierte Features aus Ursprungsdaten erzeugen.
  • Einführung in Feature Engineering.

8. Ausreißer identifizieren und ausschließen

  • Methoden zur Erkennung von Ausreißern.
  • Kriterien ungewöhnlicher Datenpunkte.
  • Robuste Maße und Reduktion der Einflüsse durch Ausreißer.

9. Daten sammeln und zusammenführen

  • Daten aus Webseiten und PDF-Dokumenten auslesen.
  • Einsatz von Regulären Ausdrücken.
  • Textdaten vor der Verarbeitung strukturieren.

10. Logistische Regression

  • Konzepte der logistischen Regression.
  • Performance-Metriken zur Evaluation.
  • Nicht-numerische Daten in Modellen einsetzen.

11. Entscheidungsbäume und Random Forests

  • Das Konzept der Decision Trees.
  • Mehrere Modelle zu Ensembles kombinieren.
  • Methoden zur Verbesserung der Vorhersagequalität.

12. Support Vector Machines

  • Einsatz von Support Vector Machines (SVM).
  • Einführung in Natural Language Processing (NLP).
  • Textklassifikation mit Bag-of-Words-Modellen.

13. Neuronale Netze

  • Grundlagen Künstlicher Neuronaler Netze (KNN).
  • Grundlagen des Deep Learnings.
  • Tieferes Verständnis der Schichten in KNN.

14. Visualisierung und Model Interpretation

  • Funktionsweisen von Modellen ableiten und darstellen.
  • Methoden zur Interpretation und Visualisierung.
  • Modellagnostische Methoden anwenden.

15. Verteilte Datenbanken einsetzen

  • Das Python-Paket PySpark einsetzen.
  • Daten aus verteilten Datenbanken auslesen.
  • Grundlagen von Big-Data-Analysen.
  • Machine-Learning-Algorithmen in verteilten Systemen nutzen.

16. Übungsprojekt

  • Umfassendes Übungsprojekt selbstständig bearbeiten.
  • Prädiktionsproblem mithilfe eines größeren Datensets lösen.
  • Vorbereitung für das Abschlussprojekt.

17. Abschlussprojekt

  • Selbstständige Analyse des Datenprojekts.
  • Ergebnispräsentation und 1:1-Feedbackgespräch mit Mentor:innen-Team.
  • Erhalt des Zertifikats zum Data Scientist mit Python.

Wie lernen Sie in dem Kurs?

Dieser Online-Kurs bietet dir ein besonders praxisorientiertes Lernkonzept mit umfassenden Selbstlerneinheiten und einem Mentor:innen-Team, das dir durchgängig zur Verfügung steht. Jede Woche wird ein neues Kapitel für dich freigeschaltet. Mit einem Zeitbudget von circa 6 Stunden pro Woche kommst du in 17 Wochen sicher ans Ziel. So lernst du in dem Kurs:

Einstufungstest: In einem Onboarding-Gespräch zu Beginn des Kurses ermittelst du zusammen mit dem Mentor:innen-Team, welche Kenntnisse du bereits besitzt und welchen Teilen des Kurses du besondere Aufmerksamkeit schenken solltest. Du wirst damit für das Lernen in den Selbstlerneinheiten optimal vorbereitet.

Data Lab: In der Lernumgebung des Kurses erwarten dich Videos, interaktive Grafiken, Text und vor allem viele Praxisübungen mit umfassenden Datasets und Coding-Aufgaben. Diese führst du direkt im Browser aus – ohne Installations- oder Konfigurationsaufwand und mit direkter Erfolgskontrolle.

Mentor:innen-Team: Für jegliche Fragen stehen dir deine Lern-Coaches bereit. Dabei handelt es sich um erfahrene Data Analysts, die dir gern weiterhelfen – per Chat, Audio- oder Videocall.

Webinare: Einmal wöchentlich hast du die Möglichkeit, an Webinaren teilzunehmen und darin in ausgewählte Spezialthemen der Datenanalyse einzutauchen.

Karriere-Coaching: Welche beruflichen Ziele verfolgst du mit deiner Weiterbildung und wie kannst du diese erreichen? Ein Mentor:innen-Team steht für dich bereit, um dir bei der Umsetzung deiner Karriereziele behilflich zu sein.

Abschlussprojekt: In einem eigenen Datenprojekt durchläufst du selbstständig die gesamte Daten-Pipeline und beantwortest typische Fragestellungen. Am Ende präsentierst du dein Projekt in einem 1-zu-1-Feedbackgespräch mit deinem Mentor:innen-Team.

Zertifikat: Nach dem Abschlussprojekt erhältst du dein offizielles Zertifikat zum Data Scientist mit Python.

Diese Online-Weiterbildung wird von unserem Partner StackFuel GmbH durchgeführt. StackFuel ist Spezialist im Bereich Weiterbildungen zu Data Literacy, Data Science und KI.

Dein Nutzen

In diesem praxisorientierten Training lernst du, selbstständig Datenanalysen mit großen Datensets durchzuführen.

Du lernst kompetent mit Python umzugehen, die Programmiersprache zur Datenauswertung einzusetzen und effektive Visualisierungen zu erstellen.

Du erfährst, wie du verschiedenste Datenquellen anbinden, Daten darin filtern und daraus zusammenführen kannst.

Du lernst umfassend Methoden, Algorithmen und Technologien des Machine Learnings kennen und erfährst, wie du diese mit Python-Paketen einsetzen kannst.

Du erfährst alles Wichtige über den Einsatz von Deep Learning und erzeugst ein künstliches neuronales Netz mit mehreren Schichten.

Nach dem Training bist du in der Lage Unternehmensdaten zu untersuchen, aussagekräftig zu visualisieren und in dynamischen Dashboards interaktiv zugänglich zu machen.

Die technischen Einstiegshürden werden durch den Einsatz von Jupyter Notebooks minimiert, mit denen du die Programmierübungen direkt im Browser durchführen kannst.

Empfohlen für

alle, die eine umfassende Schulung über Machine Learning und Data Pipelines suchen. Es werden Grundkenntnisse in Python vorausgesetzt. Die Weiterbildung eignet sich auch für Quereinsteiger:innen.

Abschlussprüfung

In einem eigenen Datenprojekt durchläufst du selbstständig die gesamte Daten-Pipeline und beantwortest typische Fragestellungen. Am Ende präsentierst du dein Projekt in einem 1-zu-1-Feedbackgespräch mit deinem Mentor:innen-Team.

Open Badges - Zeige auch digital, was du kannst.

Open Badges sind anerkannte, digitale Teilnahmezertifikate. Diese verifizierbaren Nachweise sind der aktuelle Standard für die Einbindung in Karrierenetzwerken wie z.B. LinkedIn.

Damit zeigst du digital, über welche Kompetenzen du verfügst. Nach erfolgreichem Abschluss erhältst du von uns ein Open Badge.

Mehr erfahren

Weitere Empfehlungen zu „Data Scientist mit Python“

Blick ins Produkt

Hier erhältst du Eindrücke vom Seminar sowie Informationen rund um das Seminarthema.

Fachartikel, Interviews oder Whitepaper rund um das Thema

Data Scientist: Gehalt, Aufgaben und Skills

Große Datenmengen zu strukturieren und sie dadurch in nützliche Informationen zu verwandeln – das ist die Hauptaufgabe eines Data Scientist. Als Spezialist für Daten und Datenbezüge erstellt er aus bloßen Zahlen sinnvolle Prognosen für die Zukunft und gibt dem Unternehmen Handlungsempfehlungen. Data Scientist: Key Facts Ausbildung Masterstudium Data Science, Informatik oder Mathematik Berufserfahrung von Vorteil [...]

Weitere Informationen finden Sie hier

Einblick in das Datalab

Du kannst 3 Bilder zu der Veranstaltung ansehen.

Fachartikel, Interviews oder Whitepaper rund um das Thema

Data Scientist: Gehalt, Aufgaben und Skills

Große Datenmengen zu strukturieren und sie dadurch in nützliche Informationen zu verwandeln – das ist die Hauptaufgabe eines Data Scientist. Als Spezialist für Daten und Datenbezüge erstellt er aus bloßen Zahlen sinnvolle Prognosen für die Zukunft und gibt dem Unternehmen Handlungsempfehlungen. Data Scientist: Key Facts Ausbildung Masterstudium Data Science, Informatik oder Mathematik Berufserfahrung von Vorteil [...]

Weitere Informationen finden Sie hier

Einblick in das Datalab

Du kannst 3 Bilder zu der Veranstaltung ansehen.

Digitales Lernen für Einzelpersonen
Buchungs-Nr.:
30354
€ 4.500,- zzgl. MwSt
18 Wochen (6 …
Online
4 Termine
Starttermine

Auch als englischsprachiges Training buchbar:
Data Scientist with Python

Zum Produkt

Future Jobs Classes

Werde fit für die Jobs der Zukunft und entwickle dich weiter zum Data Analyst.

In Kooperation mit

Starttermine und Details

  Zeitraum wählen
0 Termine
28.07.2025
Buchungsnummer: 30354
€ 4.500,- zzgl. MwSt.
€ 5.355,- inkl. MwSt.
Details
18 Wochen (6 Std./Woche)
08.09.2025
Buchungsnummer: 30354
€ 4.500,- zzgl. MwSt.
€ 5.355,- inkl. MwSt.
Details
18 Wochen (6 Std./Woche)
20.10.2025
Buchungsnummer: 30354
€ 4.500,- zzgl. MwSt.
€ 5.355,- inkl. MwSt.
Details
18 Wochen (6 Std./Woche)
01.12.2025
Buchungsnummer: 30354
€ 4.500,- zzgl. MwSt.
€ 5.355,- inkl. MwSt.
Details
18 Wochen (6 Std./Woche)
Plätze frei
Wenige Plätze frei
Ausgebucht
Durchführung gesichert
Buchungsnummer: 30354
€ 4.500,- zzgl. MwSt.
€ 5.355,- inkl. MwSt.
Details
18 Wochen (6 Std./Woche)
Buchungsnummer: 30354
€ 4.500,- zzgl. MwSt.
€ 5.355,- inkl. MwSt.
Details
18 Wochen (6 Std./Woche)
Bitte beachten: Wir nutzen bei ausgewählten Veranstaltungen Drittanbieter-Tools. An diese werden personenbezogene Daten der/des Teilnehmenden zur Durchführung des Weiterbildungsangebotes weitergegeben. Weitere Informationen sind in unserer Datenschutzerklärung zu finden.

Über uns – Die Haufe Akademie

Seit 1978 dein Optimierer, Innovator und Begleiter–
Dein professioneller Partner für berufliche Weiterbildung und Seminare, Schulungen und aktuelle Tagungen.

Ob vor Ort, Live-Online oder Inhouse - unsere individuellen Lösungen, unser Anspruch auf höchste Beratungskompetenz und auf dich abgestimmte Weiterbildung, vereinfachen den Erwerb von Kompetenzen für die Arbeitswelt der Zukunft und erleichtern nachhaltig die berufliche Weiterentwicklung.

Ein breites Seminar-Angebot, individuelles Coaching und unsere flexiblen Formate unterstützen HR-Verantwortliche und Entscheidende bei der Zukunftsgestaltung und Personalentwicklung von Mitarbeitenden, firmeninternen Teams und Unternehmen.

Erlebe bei uns auch von zu Hause aus die Vorzüge einer Online Weiterbildung. Unsere Online-Formate entsprechen den höchsten Ansprüchen an Qualität und stehen den Präsenzveranstaltungen auch in der Praxisnähe in nichts nach. Gemeinsam Live-Online lernen in interaktiven Gruppen oder auch digital zu einem Zeitpunkt deiner Wahl.

2.500+ Weiterbildungen
600.000+ Lernende pro Jahr
Über 95% positive Bewertungen
2.500 Trainer:innen und Coach:innen
17.500+ durchgeführte Trainings pro Jahr
Rufe uns an oder maile uns

Hast du Fragen?

Wir sind Montag bis Freitag von 8:00 bis 17:00 Uhr für dich da.

Stephanie Göpfert

Leiterin Kundenservice

*Pflichtfelder
FAQs

Fragen & Antworten

In unserem Bereich Fragen & Antworten (FAQ) findest du alle Antworten und die häufigsten Fragen zu deinem ausgewählten Thema.

Hot Skill Python

7 Gründe, warum es sich jetzt lohnt, Python zu lernen!