Schulung - PySpark - Big Data Analytics mit Apache Spark und Python
- Live Online Training
1.535,10 € inkl. 19% MwSt.
Der Kurs ist in drei thematische Bereiche unterteilt, um die Teilnehmer schrittweise an Apache Spark heranzuführen.
Im ersten Teil wird ein knapper Überblick über aktuelle Technologien zur Speicherung und Verarbeitung großer Datenmengen (Hadoop und Kubernetes) gegeben und die Rolle von Spark als wichtiges Datenverarbeitungsframework erläutert.
Der zweite Teil beinhaltet eine ausführliche Einführung in die Arbeit mit Apache Spark mit Python (PySpark). Dabei werden alle wichtigen Punkte behandelt, wie das Laden von Daten, die Datenaufbereitung (Transformation, Filtern, Joinen, Aggregation), die Anbindung verschiedener Datenquellen, die Ausführungsmodelle von Apache Spark sowie die Integration des Python Data Science Moduls Pandas und wichtige Unterschiede.
Die Teilnehmer werden all diese Schritte direkt an praktischen Beispielen und Übungen durchführen. Es werden auch gängige Grundkonzepte zur Datenorganisation in Big Data Projekten besprochen.
Im dritten Teil werden die Möglichkeiten von Spark zur Datenanalyse und zum maschinellen Lernen (ML) behandelt. Die grundlegenden Konzepte und Vorgehensweisen von ML werden kurz erläutert und anhand eines Beispiels mit PySpark praktisch angewendet.
Der Fokus des Workshops liegt auf dem Umgang mit PySpark zur Verarbeitung und Analyse großer Datenmengen. Der Bereich "Machine Learning" wird ebenfalls behandelt, jedoch nur knapp theoretisch umrissen aufgrund seiner Komplexität. Vielmehr wird darauf eingegangen, welche Möglichkeiten Apache Spark in diesem Anwendungsgebiet bietet und unter welchen Bedingungen der Einsatz von PySpark anderen Alternativen vorzuziehen ist.
Der Workshop ermöglicht es den Teilnehmern, eigenständig Daten mithilfe von Apache Spark zu transformieren und zu analysieren.
Wer sollte teilnehmen:
Zielgruppe
Der Kurs wendet sich primär an Data Scientists und Data Analysts, die mit Hilfe von Python und Apache Spark (PySpark) große Datenmengen verarbeiten und analysieren möchten.Voraussetzungen
Die Teilnehmer sollten über grundlegende Kenntnisse in Programmierung und SQL verfügen. Alle Programmierbeispiele für Apache Spark werden in Python durchgeführt. Es hat sich gezeigt, dass Teilnehmer, die Kenntnisse in anderen Programmiersprachen haben, sich schnell in Python zurechtfinden können.Englischkenntnisse, insbesondere das Verständnis von englischen Texten, sind sehr hilfreich, da Python und die Internet-Dokumentationen auf Englisch verfügbar sind. Aus diesem Grund sind auch die Folien im Kurs auf Englisch gehalten. Die Schulung selbst wird jedoch auf Deutsch abgehalten.
Trainingsprogramm
Schulungsmethode
Dieses Big Data Seminar legt einen großen Fokus auf praktische Anwendungen. Die Konzepte werden während der Schulung anhand von Folien erklärt und durch Beispiele veranschaulicht. In den Übungseinheiten haben die Teilnehmer die Möglichkeit, das Gelernte mithilfe der Programmiersprache Python in der Cloud mit Jupyter Notebooks umzusetzen. Der Trainer steht den Teilnehmern bei verschiedenen Aufgaben zur Seite und begleitet sie bei Fragen.
Hinweis
Die Teilnehmer benötigen zur Teilnahme einen eigenen Rechner, auf dem ein aktueller Browser (Chrome, Firefox, Edge) zur Teilnahme an der Video-Schulung installiert ist. Entsprechend sollten die Teilnehmer auch über Mikrofon und Kopfhörer oder Lautsprecher verfügen. Eine Kamera für die Teilnehmer ist optional und freiwillig, wäre aber sehr hilfreich.
Um ein möglichst realistisches Erlebnis zu ermöglichen, erhält jeder Teilnehmer ein eigenes kleines Cluster innerhalb der Amazon Cloud, der Zugriff erfolgt über SSH und den Web-Browser. Damit wird neben einem Web-Browser auch keine weitere Software auf den Computern der Teilnehmer benötigt.
Bitte prüfen Sie, ob Ihr Firmenlaptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript) werden im Seminar online zum Download zur Verfügung gestellt. Sie erhalten vor dem Seminar per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können.
Sie sollten sich in firmenfremde WLAN-Netze registrieren können um Zugang zum Internet am Veranstaltungsort zu haben. Einige Teilnehmer können Sie sich alternativ auch über Ihr Firmen-Handy ins Internet einwählen (WLAN-Tethering / Hotspot).
Als Backup Lösung ist es möglich, dass der USB Port bei Ihrem Laptop freigeschaltet ist, um damit verwendete Dateien oder sonstige Unterlagen übertragen zu können.
Hinweis für Online-Schulungen:
Für unsere Online-Schulungen möchten wir Sie darauf hinweisen, dass es von Vorteil ist, wenn Sie über zwei Bildschirme verfügen. Ein zusätzlicher Bildschirm ermöglicht es Ihnen, die Schulungsinhalte auf einem Bildschirm anzuzeigen, während Sie auf dem anderen Bildschirm praktische Übungen durchführen oder Anwendungen parallel öffnen können.
Durch die Verwendung von zwei Bildschirmen können Sie die Schulungsinhalte effektiver verfolgen und gleichzeitig interaktiv an den Übungen teilnehmen, ohne zwischen Fenstern hin- und herwechseln zu müssen.
Wir empfehlen daher, sich im Vorfeld auf die Schulung mit einem zusätzlichen Bildschirm vorzubereiten, um das bestmögliche Lernerlebnis zu gewährleisten
Weitere Seminare aus dem Bereich Data Science, Machine Learning & KI
Weitere Informationen
Sessions
- 1.290,00 € NettoNoch freie PlätzeJetzt buchenonline TrainingLive Online Training
- 1.290,00 € NettoNoch freie PlätzeJetzt buchenonline TrainingLive Online Training
- 1.290,00 € NettoNoch freie PlätzeJetzt buchenonline TrainingLive Online Training
- 1.290,00 € NettoNoch freie PlätzeJetzt buchencmt Computer- und Management Trainings GmbHHansastr.3280686 München
- 1.290,00 € NettoNoch freie PlätzeJetzt buchenonline TrainingLive Online Training
- 1.290,00 € NettoNoch freie PlätzeJetzt buchenCegos Integrata GmbH DüsseldorfGrafenberger Allee 29340237 Düsseldorf
Inhouse Seminare
Sparen Sie Zeit und Geld mit den Inhouse Seminaren von Cegos Integrata
Alle Seminare aus unserem offenen Angebot können Sie auch als Inhouse-Veranstaltung buchen. Im Fokus steht Ihr Unternehmen und Ihre Mitarbeiter:innen. Wir bieten Ihnen die Möglichkeit, individuelle Anforderungen und Anpassungen der Inhalte an Ihr Unternehmen vorzunehmen.
Die individuelle Lösung:
- Individueller Termin
- Individueller Ort, entweder in unseren Trainingszentren oder in Ihren eigenen Räumen
- Auf Wunsch, individuelle, auf Ihre Bedürfnisse zugeschnittene Inhalte
Inhouse Seminare
Das Inhouse-Paket umfasst:
- - die Durchführung als Live Online, Hybrid oder Präsenz Training
- - die Umsetzung durch praxiserprobte und branchenerfahrene Trainer
In Abhängigkeit von Teilnehmerzahl, Akkreditierung oder Lizenzgebühren können zusätzliche Kosten anfallen. Nicht im Preis enthalten sind dabei z.B. Raum- und Bewirtungskosten, ebenso Mehrkosten durch Seminarmaterialien.
Bitte sprechen Sie uns gerne dazu an und lassen Sie sich jetzt Ihr individuelles Angebot erstellen.
Recevoir le programme par email
Das Seminarprogramm wurde weiterentwickelt
Sie haben einen Termin aus dem Jahr ausgewählt, das Seminarprogramm wurde seither weiterentwickelt. Möchten Sie:
Sehen Sie sich das Programm für oder Ihre Buchung fortsetzen
Envoyer le programme à un collaborateur
Preis
Es entstehen keine zusätzlichen Liefer- & Versandkosten