Seminar

Building Batch Data Analytics Solutions on AWS

In diesem Kurs lernst du den Aufbau von Batch-Datenanalyselösungen mit Amazon EMR, einem verwalteten Apache Spark- und Apache Hadoop-Service der Enterprise-Klasse.

Inhalte

Erfahre, wie Amazon EMR mit Open-Source-Projekten wie Apache Hive, Hue und HBase und mit AWS-Services wie AWS Glue und AWS Lake Formation integriert wird. Der Kurs behandelt die Komponenten Datenerfassung, -aufnahme, -katalogisierung, -speicherung und -verarbeitung im Kontext von Spark und Hadoop. Du lernst die Verwendung von EMR Notebooks zur Unterstützung von Analyse- und Machine-Learning-Arbeitslasten. Du lernst auch, die besten Praktiken für Sicherheit, Leistung und Kostenmanagement auf den Betrieb von Amazon EMR anzuwenden.

Modul A: Überblick über Datenanalyse und die Datenpipeline

  • Anwendungsfälle der Datenanalyse 
  • Verwendung der Datenpipeline für die Datenanalyse

 

Modul 1: Einführung in Amazon EMR

  • Verwendung von Amazon EMR in Analyselösungen
  • Architektur von Amazon-EMR-Clustern
  • Interaktive Demo 1: Starten eines Amazon-EMR-Clusters
  • Strategien zur Kostenverwaltung

 

Modul 2: Datenanalyse-Pipeline mit Amazon EMR: Ingestion und Speicherung

  • Speicheroptimierung mit Amazon EMR
  • Techniken zur Datenübernahme

 

Modul 3: Leistungsstarke Batch-Datenanalyse mit Apache Spark auf Amazon EMR

  • Anwendungsfälle für Apache Spark auf Amazon EMR
  • Warum Apache Spark auf Amazon EMR?
  • Spark-Konzepte
  • Interaktive Demo 2: Verbinde dich mit einem EMR-Cluster und führe Scala-Befehle mit der Spark-Shell
  • Transformation, Verarbeitung und Analyse
  • Verwendung von Notebooks mit Amazon EMR
  • Practice Lab 1: Datenanalyse mit niedriger Latenz mit Apache Spark auf Amazon EMR

 

Modul 4: Verarbeiten und Analysieren von Batch-Daten mit Amazon EMR und Apache Hive

  • Verwendung von Amazon EMR mit Hive zur Verarbeitung von Stapeldaten
  • Transformation, Verarbeitung und Analyse
  • Practice Lab 2: Batch-Datenverarbeitung mit Amazon EMR und Hive
  • Einführung in Apache HBase auf Amazon EMR

 

Modul 5: Serverlose Datenverarbeitung

  • Serverlose Datenverarbeitung, -transformation und -analytik
  • Verwendung von AWS Glue mit Amazon-EMR-Arbeitslasten
  • Practice Lab 3: Orchestrierung der Datenverarbeitung in Spark mit AWS Step Functions

 

Modul 6: Sicherheit und Überwachung von Amazon EMR-Clustern

  • Sichern von EMR-Clustern
  • Interaktive Demo 3: Client-seitige Verschlüsselung mit EMRFS
  • Überwachung und Fehlersuche bei Amazon-EMR-Clustern
  • Demo: Überprüfung des Verlaufs von Apache-Spark-Clustern

 

Modul 7: Entwerfen von Batch-Datenanalyselösungen

  • Anwendungsfälle für die Batch-Datenanalytik
  • Aktivität: Entwerfen eines Arbeitsablaufs für die Batch-Datenanalyse

 

Modul B: Entwickeln moderner Datenarchitekturen auf AWS

  • Moderne Datenarchitekturen

Dein Nutzen

  • Vergleich der Funktionen und Vorteile von Data Warehouses, Data Lakes und modernen Datenarchitekturen
  • Entwerfen und Implementieren einer Lösung für die Batch-Datenanalyse
  • Identifizieren und Anwenden geeigneter Techniken, einschließlich Komprimierung, zur Optimierung der Datenspeicherung
  • Auswählen und Bereitstellen geeigneter Optionen für die Aufnahme, Umwandlung und Speicherung von Daten 
  • Auswahl der geeigneten Instanz- und Knotentypen, Cluster, automatischen Skalierung und Netzwerktopologie für einen bestimmten geschäftlichen Anwendungsfall
  • Verstehen, wie sich Datenspeicherung und -verarbeitung auf die Analyse- und Visualisierungs-Mechanismen auswirken, die für die Gewinnung verwertbarer Geschäftserkenntnisse erforderlich sind
  • Sichern von Daten im Ruhezustand und bei der Übertragung
  • Überwachung von Analyse-Workloads, um Probleme zu erkennen und zu beheben
  • Anwendung von Best Practices für das Kostenmanagement

Trainer:in

Methoden

Dieser Kurs beinhaltet Präsentationen, interaktive Demos, praktische Übungen, Diskussionen und Klassenübungen.

Teilnehmer:innenkreis

Dieser Kurs richtet sich an folgende Jobrollen:

  • Data Analytics

Wir empfehlen, dass die Teilnehmenden dieses Kurses die folgenden Voraussetzungen mitbringen:

  • Mindestens ein Jahr Erfahrung mit der Verwaltung von Open-Source-Daten-Frameworks wie Apache Spark oder Apache Hadoop
Gemeinsam online weiterbilden mehr
Buchungs-Nr.:
36413
€ 730,- zzgl. MwSt
1 Tag
Online
3 Termine
Termine

Starttermine und Details

  Zeitraum wählen
0 Termine
08.04.2024
Live-Online
Buchungsnummer: 36413
€ 730,- zzgl. MwSt.
€ 868,70 inkl. MwSt.
Durchführung
Technische Hinweise
Für die Durchführung unserer Online-Veranstaltungen nutzen wir verschiedene Techniken.
Tage & Uhrzeit
1 Tag

Montag, 08.04.2024

08:30 Uhr - 17:00 Uhr

27.05.2024
Live-Online
Buchungsnummer: 36413
€ 730,- zzgl. MwSt.
€ 868,70 inkl. MwSt.
Durchführung
Technische Hinweise
Für die Durchführung unserer Online-Veranstaltungen nutzen wir verschiedene Techniken.
Tage & Uhrzeit
1 Tag

Montag, 27.05.2024

08:30 Uhr - 17:00 Uhr

13.08.2024
Live-Online
Buchungsnummer: 36413
€ 730,- zzgl. MwSt.
€ 868,70 inkl. MwSt.
Durchführung
Technische Hinweise
Für die Durchführung unserer Online-Veranstaltungen nutzen wir verschiedene Techniken.
Tage & Uhrzeit
1 Tag

Dienstag, 13.08.2024

08:30 Uhr - 17:00 Uhr

Plätze frei
Wenige Plätze frei
Ausgebucht
Nächste Buchung sichert Durchführung
Buchungsnummer: 36413
€ 730,- zzgl. MwSt.
€ 868,70 inkl. MwSt.
Details
1 Tag
Buchungsnummer: 36413
€ 730,- zzgl. MwSt.
€ 868,70 inkl. MwSt.
Details
1 Tag
Später buchen
Gerne reservieren wir Ihnen kostenlos und unverbindlich einen Teilnehmerplatz bei der gewünschten Veranstaltung.
Kein passender Termin?
Lassen Sie sich bei neuen Terminen per E-Mail benachrichtigen, falls keiner der Bestehenden für Sie in Frage kommt.

Das Training wird in Zusammenarbeit mit einem autorisierten Trainingspartner durchgeführt.

Dieser erhebt und verarbeitet Daten in eigener Verantwortung. Bitte nehme die entsprechende Datenschutzerklärung zur Kenntnis

 

Über uns – Die Haufe Akademie

Seit 1978 Ihr Optimierer, Innovator und Begleiter–
Ihr professioneller Partner für berufliche Weiterbildung und Seminare, Schulungen und aktuelle Tagungen.

Ob vor Ort, Live-Online oder Inhouse - unsere individuellen Lösungen, unser Anspruch auf höchste Beratungskompetenz und auf Sie abgestimmte Weiterbildung, vereinfachen den Erwerb von Kompetenzen für die Arbeitswelt der Zukunft und erleichtern nachhaltig die berufliche Weiterentwicklung.

Unsere professionellen Unternehmenslösungen und Organisationsentwicklungsprogramme, ein breites Seminar-Angebot, individuelles Coaching und unsere flexiblen Formate unterstützen HR-Verantwortliche und Entscheider:innen bei der Zukunftsgestaltung und Personalentwicklung von Mitarbeitenden, firmeninternen Teams und Unternehmen.

Erleben Sie bei uns auch von zu Hause aus die Vorzüge einer Online Weiterbildung. Unsere Online-Formate entsprechen den höchsten Ansprüchen an Qualität und stehen den Präsenzveranstaltungen auch in der Praxisnähe in nichts nach. Gemeinsam Live-Online lernen in interaktiven Gruppen oder auch digital zu einem Zeitpunkt Ihrer Wahl.

2.300 Weiterbildungen
510.300 Lerner:innen pro Jahr
Über 95% positive Bewertungen
Über 2.000 Trainer:innen und Coach:innen
14.200 durchgeführte Trainings pro Jahr
Sie haben Fragen?
Rufen Sie uns an oder mailen Sie uns
Wir sind Mo - Fr 8:00 - 17:00 Uhr für Sie da.
Stephanie Göpfert
Leiterin Kundenservice

Fragen & Antworten
In unserem Bereich Fragen & Antworten (FAQ) finden Sie alle Antworten und die häufigsten Fragen zu Ihrem ausgewählten Thema.
Ihre Nachricht an uns
*Pflichtfelder