Full Digital
 
Fantom Tag

Schulung - Einführung in Data Science mit Python für Anfänger:innen

Praxisorientierter Einstieg in Data Science mit Python - von der Datenaufbereitung bis zu ersten Machine-Learning-Modellen

  • Live Online Training
DURCHFÜHRUNG MIT TERMIN
Dauer
3 Tage (21 Stunden)

Preis ab
1.950,00 € netto
2.320,50 € inkl. 19% MwSt.

Nr.
54411
TERMIN UND ORT NACH ABSPRACHE
Dauer
3 Tage (21 Stunden)


Nr.
54411
On-demand Training
Sind Sie an diesem Thema interessiert?
Unsere Experten entwickeln Ihr individuell angepasstes Seminar!
Datenkompetenz zählt heute zu den zentralen Schlüsselqualifikationen in nahezu allen Branchen - insbesondere im Umgang mit großen Datenmengen und der Entwicklung datenbasierter Entscheidungsgrundlagen.  

In diesem dreitägigen Seminar erhalten Sie einen praxisorientierten Einstieg in Data Science mit Python. Sie lernen, Daten mit Python einzulesen, aufzubereiten, zu analysieren und mit gängigen Bibliotheken anschaulich zu visualisieren. Auf dieser Grundlage bekommen Sie einen überblicksartigen Einstieg in ausgewählte Machine-Learning-Verfahren, ohne dass dafür eine tiefgehende mathematische Herleitung im Vordergrund steht.

Das Seminar ist speziell für Einsteiger:innen konzipiert, die erste Erfahrungen im Umgang mit Daten mitbringen und den Data-Science-Ansatz sowie die praktische Arbeit mit Python kennenlernen möchten.

Nach dem Seminar sind Sie in der Lage, Daten selbstständig aufzubereiten, zu analysieren und erste Modelle des maschinellen Lernens in Python anzuwenden - eine wertvolle Grundlage für Ihre weitere Entwicklung im Bereich Data Science.

Dieses Seminar ist Teil dieses Qualifizierungsplaners:

Zielgruppe

Wer sollte teilnehmen:

Zielgruppe

  • Der Kurs richtet sich an Fachkräfte, die Python erlernen möchten, um Datenanalysen durchzuführen und Machine-Learning-Algorithmen zu programmieren.
  • Besonders geeignet für Anwender:innen, die die Grundlagen der Data Science kennenlernen möchten, wie z. B. Datenanalystinnen und -analysten, IT-Spezialistinnen und -Spezialisten sowie Ingenieurinnen und Ingenieure.
  • Berufseinsteiger:innen im Bereich Data Science, die einen praxisorientierten Einstieg suchen.

Voraussetzungen

  • Für eine erfolgreiche Teilnahme sollten Sie grundlegende mathematische Kenntnisse (z. B. Mittelwerte, Varianz, einfache Funktionen, Normalverteilung) und eine gewisse Vertrautheit im Umgang mit Daten mitbringen, etwa durch die Arbeit mit Excel-Auswertungen oder Berichten.
  • Erste Programmiererfahrung ist hilfreich, aber keine zwingende Voraussetzung, da zentrale Python-Grundlagen im Seminar eingeführt werden.
  • Englischkenntnisse auf Lesekompetenzniveau sind notwendig, da viele Fachbegriffe, Bibliotheksnamen und Teile der Dokumentation in englischer Sprache vorliegen.
Trainingsprogramm

Trainingsprogramm

Grundlegende Konzepte in Python:

  • Installation neuer Pakete
  • Verwendung von JupyterLab und .ipynb als Entwicklungsumgebung (IDE)
  • Unterschiede in Funktionen und Methoden
  • Vergleich wichtiger Python-Aspekte mit anderen Programmiersprachen

Arbeiten mit dem pandas-Paket und DataFrames:

  • Struktur eines DataFrames (Zeilen, Spalten)
  • Auswahl von Zeilen und Spalten
  • Erstellen, Löschen und Ändern von Zeilen und Spalten
  • Verwendung von Boolean-Indexing zur Zeilenauswahl anhand logischer Abfragen
  • Zusammenfassung von Daten für einen Überblick

Berechnung von Statistiken direkt in pandas DataFrames:

  • Durchführung einfacher Statistiken direkt auf DataFrames (Durchschnitt, Minimum, Maximum, Summe, Median, Varianz usw.)
  • Aggregation und Filterung von Daten
  • Ersetzen von fehlenden Werten
  • Erstellung von Kreuztabellen (Kontingenztabellen)

Datenverarbeitung: Einlesen und Schreiben von Daten:

  • Festlegung des Arbeitsverzeichnisses in Python und der IDE Spyder
  • Einlesen und Schreiben von CSV- und Excel-Dateien
  • Datenimport von einer URL
  • Übersicht über nützliche Parameter
  • Lesen und Schreiben im Python-Format "pickle"
  • Handhabung großer Datensätze

Kontrollstrukturen:

  • Erstellung eigener Funktionen
  • Festlegung von Standardparametern in Funktionen (Positional Arguments und Keyword Arguments)
  • Anwendung von For-Schleifen
  • Implementierung von If-Else-Bedingungen
  • Verwendung von List Comprehensions mit If-Else

Datenvisualisierung mit seaborn/matplotlib:

  • Grundlegende Aspekte von matplotlib
  • Anpassung von Achsenbeschriftung, Legende und Titel
  • Speichern von Diagrammen
  • Erstellung von Diagrammtypen wie Linien-, Box-, Histogramm-, Scatter- und Balkendiagrammen in seaborn
  • Variation oder Festlegung von Darstellungsmerkmalen (Punktgröße, Farbe, Gruppierung) durch eine Variable

Textmanipulation im DataFrame und Einführung in numpy:

  • Zeilenweise Textbearbeitung in DataFrames
  • Extraktion von Informationen aus Texten
  • Erstellung von numpy-Arrays und Slicing nach Zeilen und Spalten
  • Anwendung von Funktionen auf numpy-Arrays

Überblick über Machine Learning:

  • Einführung in das Konzept des Machine Learnings
  • Praktische Anwendungsbeispiele
  • Unterscheidung von künstlicher Intelligenz, Machine Learning und Deep Learning
  • Erklärung des Unterschieds zwischen überwachtem und unüberwachtem Lernen
  • Besprechung von Overfitting, Train-Test-Split und Kreuzvalidierung

Entscheidungsbaum mit scikit-learn:

  • Datenaufteilung in Test- und Trainingsdaten, Modellerstellung und Validierung
  • Grundlagen des Entscheidungsbaum-Algorithmus
  • Umsetzung in Python
  • Ergebnisvalidierung (u. a. Verwirrungsmatrix, Sensitivität, Genauigkeit)
  • Anpassung von Hyperparametern während des Trainings

Neuronales Netz und K-Nearest Neighbor:

  • Grundlagen dieser Algorithmen
  • Training eines Multi-Layer-Perceptrons (MLP)
  • Umsetzung in Python mit scikit-learn
  • Ergebnisvalidierung (u. a. Verwirrungsmatrix, Sensitivität, Genauigkeit)
  • Anpassung von Hyperparametern

K-Means Clustering:

  • Erstellung und Validierung eines Cluster-Modells
  • Grundlagen des K-Means-Algorithmus
  • Umsetzung in Python mit scikit-learn
  • Ergebnisvalidierung

Clustering mit DBSCAN:

  • Funktionsweise des DBSCAN-Clustering-Algorithmus
  • Worin liegt der Unterschied zu K-Means?
  • Umsetzung in Python mit scikit-learn
  • Ergebnisvalidierung (Sillhouette Score, Calinski-Harabasz)
Schulungsmethode

Schulungsmethode

Neben einer Vielzahl von Programmieraufgaben haben die Teilnehmer:innen die Möglichkeit, diese Aufgaben eigenständig mit Unterstützung der Trainer:innen in Python zu lösen. Das Ziel ist es, das Gelernte zu festigen und zu vertiefen. Bei individuellen Unklarheiten stehen die Trainer:innen direkt zur Verfügung, um Fragen zu beantworten. Es stehen Aufgaben mit unterschiedlichen Schwierigkeitsgraden zur Verfügung, sodass Sie die Inhalte Schritt für Schritt vertiefen und an Ihren eigenen Lernstand anpassen können.  

Im Seminar werden in jedem Block (meistens ca. 90 Minuten lang) sowohl theoretische als auch praktische Einheiten behandelt. Die theoretischen Einheiten dienen dazu, das notwendige Wissen zu vermitteln, um die Übungsaufgaben zu verstehen und eigenständig lösen zu können. Dabei konzentrieren wir uns auf den theoretischen Stoff, der das Verständnis verbessert und vermeiden ausführliche, wissenschaftliche Theorieeinheiten. Der Schwerpunkt liegt auf der praktischen Anwendung, also dem Schreiben von Code und dem Lösen von kleinen Verständnisaufgaben. Teilnehmer:innen können jederzeit Fragen stellen, die während der praktischen Einheiten individuell von den Trainerinnen und Trainern beantwortet werden. Fragen von allgemeinem Interesse werden allen Teilnehmenden erklärt. Sie erhalten die Theorie und weitere Code-Erklärungen als PDF und gedruckte Version. Codebeispiele und Musterlösungen der Übungsaufgaben sind in digitaler Form verfügbar.  

Die Übungen bestehen hauptsächlich aus Coding-Aufgaben, bei denen Sie entweder kurze Codebeispiele schreiben oder Lücken in vorhandenem Code ergänzen müssen. Letzteres fördert das Verständnis für Code. Die Aufgaben sind so gestaltet, dass sie von allen Teilnehmern innerhalb der verfügbaren Zeit gelöst werden können. Es stehen Aufgaben mit unterschiedlichen Schwierigkeitsgraden zur Verfügung, sodass Sie die Inhalte Schritt für Schritt vertiefen und an Ihren eigenen Lernstand anpassen können. Darüber hinaus gibt es für einige Kapitel kurze Kontrollfragen zum theoretischen Teil. 

Hinweis

Hinweis

Die Teilnehmer:innen benötigen für die Übungsaufgaben Laptops. Wir empfehlen Ihnen, mit einem eigenen Laptop zu arbeiten, auf dem Sie die bereitgestellte Arbeitsumgebung bzw. die benötigte Software nutzen können. Eine genaue Installationsanleitung für die Software wird Ihnen vor dem Seminar per E-Mail zugesendet. Auf Anfrage stellen wir auch Schulungslaptops zur Verfügung.  
Bitte prüfen Sie, ob Ihr Firmenlaptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript, Code, Dateien) werden im Kurs online zum Download zur Verfügung gestellt. Sie erhalten vor der Schulung per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können.  
Sie sollten sich in firmenfremde WLAN-Netze registrieren können.  
Als Backup-Lösung ist es möglich, dass der USB-Port bei Ihrem Laptop freigeschaltet ist, um damit im Seminar verwendete Dateien oder sonstige Unterlagen übertragen zu können.  
Im Seminar wird das Betriebssystem Windows verwendet. Der Umgang mit Ihrem verwendeten Betriebssystem und Laptop sollte bekannt sein. Insbesondere sollten Sie ohne Schwierigkeiten Sonderzeichen auf der Tastatur finden (insbesondere bei Apple Geräten werden auf manchen Tastaturen nicht immer runde, eckige bzw. geschweifte Klammern dargestellt).  

Hinweis für Online-Schulungen:  

Für die Online-Teilnahme ist ein zweiter Bildschirm von Vorteil, so können Sie auf einem Bildschirm die Präsentation verfolgen und auf dem anderen Ihre Jupyter-Notebooks bzw. Übungen bearbeiten, ohne zwischen Fenstern wechseln zu müssen.

Weiterführende Informationen: Eine Auswahl vertiefender Inhalte und praxisorientierter Beiträge zum Thema Datenkompetenz findet sich im Datenkompetenz‑Blog.

Häufig gestellte Fragen (FAQ)

Häufig gestellte Fragen (FAQ)

Welche Vorteile bringt mir das Seminar?  

Die im Seminar erworbenen Kenntnisse unterstützen Sie dabei, Datenanalysen fundierter zu verstehen, datenbasierte Entscheidungen besser nachzuvollziehen und sich perspektivisch in datenorientierten Rollen und Projekten zu positionieren. Das Seminar verbessert damit Ihre Fähigkeiten in Data Science und Machine Learning, speziell mit Python. Dies kann Ihre Positionierung in datenorientierten Rollen unterstützen.

Für wen ist dieses Seminar geeignet?

Das Seminar richtet sich an Einsteiger:innen in Data Science, die ein grundlegendes Verständnis für den Umgang mit Daten entwickeln und erste praktische Erfahrungen mit Python als Datenanalyse-Werkzeug sammeln möchten. Angesprochen sind z. B. Analystinnen und Analysten, Fachanwender:innen, Nachwuchs-Data-Scientists und alle, die datengetriebene Entscheidungen besser verstehen und unterstützen wollen.

Welche Voraussetzungen muss ich mitbringen?

Sie sollten grundlegende mathematische Kenntnisse (z. B. Prozentrechnung, einfache Funktionen, Mittelwert/Varianz, Normalverteilung) und eine gewisse Vertrautheit im Umgang mit Daten (z. B. Excel-Auswertungen, einfache Berichte) mitbringen. Erste Programmiererfahrung ist hilfreich, aber nicht zwingend erforderlich - wichtige Python-Grundlagen werden im Seminar eingeführt.

Welche Rolle spielen Englischkenntnisse?

Englischkenntnisse auf Lesekompetenzniveau sind notwendig, da viele Fachbegriffe, Bibliotheksnamen und Teile der Dokumentation in englischer Sprache vorliegen. Im Seminar werden diese Begriffe erklärt und im Kontext eingeordnet.

Muss ich Python bereits beherrschen?

Nein, Sie müssen Python nicht beherrschen, sollten jedoch bereit sein, sich aktiv auf eine Programmiersprache einzulassen. Das Seminar führt Schritt für Schritt in die Arbeit mit Python ein und zeigt, wie typische Data-Science-Aufgaben mit Bibliotheken wie NumPy, pandas und Matplotlib gelöst werden können.

Welche Tools und Arbeitsumgebungen werden verwendet?

Im Seminar arbeiten Sie mit JupyterLab als interaktive Entwicklungsumgebung und sogenannten Notebooks (.ipynb), in denen Code, Visualisierungen und Erläuterungen kombiniert werden. Je nach Setup werden vorbereitete Umgebungen bereitgestellt oder die Installation vorab beschrieben.

Wie ist das Seminar aufgebaut und welche Methoden kommen zum Einsatz?

Das Seminar kombiniert kurze theoretische Inputs mit vielen praktischen Übungen. Sie folgen einem durchgängigen Workflow - von der Datenaufbereitung über Exploration und Visualisierung bis hin zu einfachen Machine-Learning-Modellen. Die Inhalte werden live demonstriert und anschließend von Ihnen in eigenen Notebooks nachbearbeitet.

Welche Themen aus Data Science und Machine Learning werden behandelt?

Sie erhalten einen praxisorientierten Überblick über den typischen Data-Science-Prozess: Daten einlesen und aufbereiten, explorative Datenanalyse, Visualisierung, einfache Klassifikations- und Regressionsmodelle sowie einen Einstieg in Clustering-Verfahren. Der Fokus liegt auf dem Verständnis der Abläufe und weniger auf komplexen mathematischen Herleitungen.

Benötige ich einen eigenen Laptop?

Wir empfehlen Ihnen, mit einem eigenen Laptop zu arbeiten, auf dem Sie die bereitgestellte Arbeitsumgebung bzw. die benötigte Software nutzen können. Für die Online-Teilnahme ist ein zweiter Bildschirm von Vorteil, um Seminarinhalte und eigene Notebooks parallel im Blick zu behalten.

Welche Unterlagen und Beispiele erhalte ich?

Sie erhalten die im Seminar verwendeten Notebooks, Beispiel-Datensätze und ergänzende Materialien, damit Sie die gezeigten Schritte im Anschluss sel

Termine

  • 1.950,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
  • 1.950,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
  • 1.950,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
  • 1.950,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
  • 1.950,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
  • 1.950,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    Cegos Integrata GmbH Stuttgart
    Löffelstr. 40
    70597 Stuttgart
  • 1.950,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
  • 1.950,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
  • 1.950,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    Cegos Integrata GmbH Düsseldorf
    Grafenberger Allee 293
    40237 Düsseldorf
Schulung - Einführung in Data Science mit Python für Anfänger:innen