Schulung - Big Data II - Praxis-Vertiefung
Data Engineering Schulung für moderne Datenpipelines mit Spark, Kafka, dbt und DuckDB
Live Online oder Präsenz
1.892,10 € inkl. 19% MwSt.
Unsere Experten entwickeln Ihr individuell angepasstes Seminar!
Dieses Big Data Training zeigt Ihnen, wie moderne Datenplattformen praktisch aufgebaut, erweitert und betrieben werden. Im Mittelpunkt steht die Umsetzung realer Datenpipelines: Sie laden Daten aus verschiedenen Quellen, transformieren und modellieren diese strukturiert und lernen, wie Daten zuverlässig, skalierbar und nachvollziehbar bereitgestellt werden.
In dieser Data Engineering Schulung arbeiten Sie mit aktuellen Werkzeugen wie dlt, dbt, DuckDB, Apache Spark und Apache Kafka. Sie lernen, wie moderne ELT-Workflows entstehen, wie Datenqualität sichergestellt wird und wie sich Batch- und Streaming-Prozesse in einer produktionsnahen Umgebung verbinden lassen.
Das Seminar legt den Fokus auf praktische Handlungsfähigkeit. Sie arbeiten mit realistischen Musterdaten, entwickeln End-to-End-Datenpipelines und erhalten Vorlagen, Patterns und Best Practices, die Sie auf eigene Projekte übertragen können.
Ihre Vorteile / Nutzen
Für Teilnehmende:
Sie können moderne Datenpipelines eigenständig planen, entwickeln, testen und stabil betreiben. Sie gewinnen Sicherheit im Umgang mit wichtigen Data-Engineering-Tools und verstehen, wie Spark, Kafka, dbt, DuckDB und dlt in realen Datenplattformen zusammenspielen.
Für Unternehmen:
Unternehmen profitieren von skalierbaren, wartbaren und effizient betriebenen Datenprozessen. Dadurch entsteht eine verlässliche Grundlage für Analytics, Reporting, KI-Anwendungen und datenbasierte Produkte.
Dieses Seminar eignet sich für alle, die Big Data praktisch anwenden und moderne Datenpipelines selbst entwickeln möchten.
Jetzt Platz sichern und teilnehmen.
Seminarziel
Sie entwickeln die Fähigkeit, moderne Datenpipelines eigenständig zu planen, zu implementieren und zu betreiben. Dabei verbinden Sie Data Engineering Best Practices mit praktischer Umsetzung in den Bereichen Datenaufnahme, Transformation, Datenqualität, Batch-Verarbeitung, Streaming und Performanceoptimierung.
Lernziele - Sie lernen:
- Daten aus APIs, Datenbanken und Dateien strukturiert zu laden, zu transformieren und aufzubereiten.
- Moderne ETL- und ELT-Workflows zu entwerfen und in Data-Engineering-Projekten umzusetzen.
- dlt für Data Ingestion, Schema Evolution und inkrementelles Laden einzusetzen.
- dbt für Datenmodellierung, Tests, Dokumentation und Data Quality zu nutzen.
- DuckDB für lokale Analytics, schnelle Datenexploration und OLAP-Szenarien einzusetzen.
- Apache Spark für verteilte Batch-Verarbeitung zu verwenden und Performanceprobleme zu erkennen.
- Apache Kafka für Event Streaming und Echtzeit-Datenpipelines zu konfigurieren.
- Datenpipelines zu überwachen, zu testen und produktionsnah zu betreiben.
- Performance- und Kostenfaktoren in Datenplattformen zu bewerten.
- Best Practices für stabile, wartbare und nachvollziehbare Datenpipelines anzuwenden.
Das Seminar stärkt Ihre technisch-operative Kompetenz im Data Engineering. Sie bauen praktische Fähigkeiten im Umgang mit Datenpipelines, ELT-Workflows, Datenmodellierung, Spark, Kafka, dbt und DuckDB auf.
Gleichzeitig entwickeln Sie ein systematisches Architekturverständnis und stärken Ihre praktische Entscheidungsfähigkeit beim Aufbau datengetriebener Prozesse. Dazu gehören auch analytisches Denken, Fehlersuche, Qualitätsbewusstsein und der strukturierte Transfer in reale Projekte.
Wer sollte teilnehmen:
Zielgruppe
Das Seminar richtet sich an Data Engineers, Data Scientists, Softwareentwickler:innen, Analytics Engineers sowie technisch affine Anwender:innen, die bereits Grundlagen im Big-Data-Umfeld besitzen und nun praxisorientierte Umsetzungskompetenz aufbauen möchten.Besonders geeignet ist das Training für Teams, die Datenpipeline-Prozesse professionalisieren, Data-Engineering-Kompetenz aufbauen oder moderne Tools wie Spark, Kafka, dbt und DuckDB in der Praxis kennenlernen möchten.
Voraussetzungen
Grundlagenwissen zu Big-Data-Architekturen und Datenkonzepten wird vorausgesetzt, zum Beispiel durch die Teilnahme an 54601 - Big Data I - GrundlagenBasiskenntnisse in SQL sind hilfreich. Erste Erfahrung mit Python oder einer anderen Programmiersprache ist von Vorteil, aber nicht zwingend erforderlich.
Trainingsprogramm
Methodik
Das Seminar kombiniert Hands-on Labs, Live Coding, Mini-Projekte, technische Impulse, Diskussion realer Anwendungsfälle sowie Best Practices und Troubleshooting-Sessions.
Der Fokus liegt klar auf praktischer Umsetzung: Die Teilnehmenden arbeiten mit vorbereiteten Übungen, realitätsnahen Daten und nachvollziehbaren Patterns. Dadurch entsteht eine direkte Verbindung zwischen Schulungsinhalten und typischen Anforderungen aus Data-Engineering-Projekten.
Hinweis
Hinweis für Online-Schulungen:
Wir empfehlen daher, sich im Vorfeld auf die Schulung mit einem zusätzlichen Bildschirm vorzubereiten, um das bestmögliche Lernerlebnis zu gewährleisten.
Häufig gestellte Fragen (FAQ)
Was ist der Unterschied zwischen Big Data I und Big Data II?
Big Data I vermittelt Grundlagen, Begriffe und Architekturverständnis. Big Data II ist die praxisorientierte Vertiefung und konzentriert sich auf die konkrete Umsetzung moderner Datenpipelines.
Für wen eignet sich dieses Big Data Training?
Das Training eignet sich für Data Engineers, Data Scientists, Softwareentwickler:innen, Analytics Engineers und technisch affine Fachkräfte, die moderne Datenpipelines praktisch entwickeln möchten.
Ist Big Data II eine Data Engineering Schulung?
Ja. Das Seminar ist als praxisnahe Data Engineering Schulung aufgebaut. Es behandelt Datenaufnahme, Transformation, Datenmodellierung, Spark, Kafka, Datenqualität und produktionsnahe Pipeline-Prozesse.
Welche Tools werden im Seminar eingesetzt?
Zum Einsatz kommen unter anderem dlt, dbt, DuckDB, Apache Spark und Apache Kafka. Je nach Übung werden zusätzlich typische Konzepte moderner Datenplattformen behandelt.
Ist das Seminar auch als Spark Kafka Schulung geeignet?
Ja. Spark und Kafka werden als wichtige Bausteine moderner Datenplattformen behandelt. Sie lernen die grundlegenden Konzepte, typischen Einsatzszenarien und das Zusammenspiel mit Datenpipelines kennen. Das Seminar vermittelt jedoch keine tiefgehende Spark- oder Kafka-Administration, sondern zeigt, wie beide Technologien im Kontext von Big Data und Data Engineering sinnvoll eingeordnet und praktisch genutzt werden.
Was lerne ich über Datenpipelines?
Sie lernen, Daten aus verschiedenen Quellen zu laden, zu transformieren, zu modellieren, zu testen und bereitzustellen. Dabei entwickeln Sie ein Verständnis für robuste und wartbare End-to-End-Datenpipelines.
Benötige ich Programmiererfahrung?
Basiskenntnisse in SQL sind hilfreich. Erste Erfahrung mit Python oder einer anderen Programmiersprache ist von Vorteil, aber nicht zwingend erforderlich.
Wird eine Schulungsumgebung bereitgestellt?
Ja. Für das Seminar steht eine vorbereitete Schulungsumgebung zur Verfügung. Dadurch kann der Fokus auf den Übungen und den Data-Engineering-Konzepten liegen.
Kann das Seminar als Inhouse-Schulung durchgeführt werden?
Ja. Das Seminar kann als Inhouse-Training durchgeführt und bei Bedarf auf Zielgruppe, Toollandschaft oder konkrete Unternehmensszenarien angepasst werden.
Welches Seminar folgt nach Big Data II?
Als nächster Schritt eignet sich 54603 - Big Data III - Advanced Training, wenn Sie Themen wie Streaming-Architekturen, DataOps, Governance und produktionsreifen Betrieb vertiefen möchten.
Termine
- 1.590,00 € NettoNoch freie PlätzeJetzt buchenonline TrainingLive Online Training
- 1.590,00 € NettoNoch freie PlätzeJetzt buchenonline TrainingLive Online Training
Inhouse Seminare
Sparen Sie Zeit und Geld mit den Inhouse Seminaren von Cegos Integrata
Alle Seminare aus unserem offenen Angebot können Sie auch als Inhouse-Veranstaltung buchen. Im Fokus steht Ihr Unternehmen und Ihre Mitarbeiter:innen. Wir bieten Ihnen die Möglichkeit, individuelle Anforderungen und Anpassungen der Inhalte an Ihr Unternehmen vorzunehmen.
Die individuelle Lösung:
- Individueller Termin
- Individueller Ort, entweder in unseren Trainingszentren oder in Ihren eigenen Räumen
- Auf Wunsch, individuelle, auf Ihre Bedürfnisse zugeschnittene Inhalte
Inhouse Seminare
Das Inhouse-Paket umfasst:
- - die Durchführung als Live Online, Hybrid oder Präsenz Training
- - die Umsetzung durch praxiserprobte und branchenerfahrene Trainer
In Abhängigkeit von Teilnehmerzahl, Akkreditierung oder Lizenzgebühren können zusätzliche Kosten anfallen. Nicht im Preis enthalten sind dabei z.B. Raum- und Bewirtungskosten, ebenso Mehrkosten durch Seminarmaterialien.
Bitte sprechen Sie uns gerne dazu an und lassen Sie sich jetzt Ihr individuelles Angebot erstellen.
Recevoir le programme par email
Envoyer le programme à un collaborateur
Preis
Es entstehen keine zusätzlichen Liefer- & Versandkosten

