Full Digital
 
Fantom Tag

Schulung - Machine Learning mit Python & Scikit Learn

Grundlagen des Maschinellen Lernens mit scikit-learn und Python

  • Live Online Training
DURCHFÜHRUNG MIT TERMIN
Dauer
2 Tage (14 Stunden)

Preis ab
1.300,00 € netto
1.547,00 € inkl. 19% MwSt.

Referenz
54500
TERMIN UND ORT NACH ABSPRACHE
Dauer
2 Tage (14 Stunden)


Referenz
54500
On-demand Training
Sind Sie an diesem Thema interessiert?
Unsere Experten entwickeln Ihr individuell angepasstes Seminar!

Machine Learning ist ein zentrales Werkzeug moderner Datenanalyse - und gewinnt in nahezu allen Branchen an Bedeutung. In diesem zweitägigen Seminar lernen Sie, wie Sie mit der Programmiersprache Python und der Bibliothek scikit-learn praxisnah Machine-Learning-Modelle entwickeln. Der Fokus liegt auf überwachten Lernverfahren wie linearer und logistischer Regression, Entscheidungsbäumen, Random Forests sowie neuronalen Netzen. Auch Methoden des unüberwachten Lernens wie K-Means und DBSCAN werden behandelt. Sie arbeiten dabei aktiv in JupyterLab und vertiefen Ihr Wissen durch zahlreiche Übungen.

Das Seminar findet wahlweise als Präsenzseminar oder als Live Online Training statt und verbindet theoretische Grundlagen des Machine Learning mit umfangreichen praktischen Übungen in Python.

Nach dem Seminar sind Sie in der Lage, Machine-Learning-Algorithmen selbstständig anzuwenden, Modelle zu bewerten und Ihre Python-Kenntnisse gezielt für datengetriebene Aufgaben einzusetzen. Sie schaffen damit eine fundierte Grundlage für weiterführende Anwendungen im Bereich Data Science.

Dieses Seminar ist Teil dieses Qualifizierungsplaners:

Zielgruppe

Wer sollte teilnehmen:

Zielgruppe

  • Die Schulung richtet sich an Fachkräfte wie Data Scientists, angehende Machine Learning Engineers, Datenanalystinnen und -analysten, Business Intelligence sowie und Data Analystinnen und Analysten, die ihre Python-Kenntnisse im Bereich Data Science und Data Mining vertiefen möchten.
  • Besonders geeignet für Personen, die bereits über grundlegende Programmierkenntnisse in Python verfügen und diese erweitern wollen, um Machine Learning mit scikit-learn eigenständig umzusetzen.

Voraussetzungen

  • Programmiererfahrung in Python ist erforderlich, insbesondere im Umgang mit pandas DataFrames, Installation und Nutzung von Bibliotheken sowie dem Schreiben eigener Funktionen.
  • Grundkenntnisse in Statistik (z. B. Durchschnitt, Median, Standardabweichung) und mathematischen Symbolen (z. B. Summenzeichen, Integral) sind notwendig.
  • Kenntnisse der booleschen Algebra und logischen Operatoren (UND, ODER, NICHT) werden vorausgesetzt.
  • Englischkenntnisse sind empfehlenswert, da die Programmiersprache und Fachbegriffe häufig auf Englisch sind. Die Schulungsunterlagen sind ebenfalls in Englisch, die Schulung wird hingegen auf Deutsch durchgeführt.
Programm

Trainingsprogramm

Grundlegende Einblicke in das Feld des Maschinellen Lernens:

  • Einführung in das Gebiet des Maschinellen Lernens
  • Erläuterung der Unterschiede zwischen überwachtem und unüberwachtem Lernen
  • Überwindung von Overfitting durch kluge Datasplitting-Strategien (Training vs. Testdaten)

Basiswissen zur Linearen Regression:

  • Verständnis für den Linearen Regressionsalgorithmus aufbauen
  • Richtige Aufteilung von Daten in Training und Test
  • Praktische Umsetzung der Linearen Regression in Python (mit scikit-learn)
  • Solide Überprüfung der Ergebnisse

Eintauchen in die Logistische Regression (unter Nutzung von StatsModels):

  • Aufbau des Verständnisses für die Logistische Regression (Entwicklung von linear zu logistisch)
  • Sorgfältige Datenaufteilung für Training und Test
  • Implementierung der Logistischen Regression in Python
  • Kritische Prüfung und Bewertung der Ergebnisse und des Modells (AIC, BIC, Konfusionsmatrix)
  • Erläuterung der Koeffizienteninterpretation (Odds-Ratio)
  • Roc Curve und Fläche unter der Kurve (AUC) im Fokus

Tiefere Einblicke in den Entscheidungsbaum-Algorithmus:

  • Verständnis für den Entscheidungsbaum-Algorithmus entwickeln
  • Richtige Aufteilung von Daten in Training und Test
  • Konkrete Umsetzung des Entscheidungsbaums in Python (mit scikit-learn)
  • Feintuning der Hyperparameter für optimale Leistung
  • Sorgfältige Validierung der Ergebnisse (Konfusionsmatrix, Genauigkeit)
  • Anwendung des Entscheidungsbaums für Regressionsszenarien

Ensemble-Methoden und ihre Effektivität:

  • Ein Ensemble aus verschiedenen Algorithmen mit scikit-learn realisieren
  • Random Forest für Klassifikation und Regression nutzen
  • Einsatz von Ada Boost für Klassifikation und Regression verstehen
  • Feintuning der Hyperparameter für optimierte Ergebnisse
  • Akkurate Bewertung der Modellleistung durch gezielte Validierung

Erkundung weiterer Schlüsselalgorithmen:

  • K-Nearest Neighbor-Verfahren beleuchten
  • Einfaches Neuronales Netz (Multi-Layer Perceptron, MLP) betrachten
  • Direkte Umsetzung der Algorithmen in Python
  • Gründliche Ergebnisüberprüfung und -bewertung

Optimierung von Hyperparametern und Anwendung von Kreuzvalidierung:

  • Automatisierte Suche nach optimalen Hyperparametern
  • Kreuzvalidierung (Cross-Validation) als Schlüssel zur Modellbewertung
  • Umsetzung dieser Konzepte in scikit-learn

Erkundung von Clustering-Algorithmen:

  • Basisverständnis für K-Means Clustering und DBScan erlangen
  • Interpretation der Ergebnisse von Clustering-Vorgängen
  • Vergleich der Ergebnisse verschiedener Clustering-Methoden
Pädagogik

Pädagogik

Das Seminar kombiniert kurze theoretische Impulse mit Live-Demonstrationen in Python mit umfangreichen Hands-on-Übungen. Die Teilnehmer:innen arbeiten direkt in JupyterLab und wenden die Methoden auf realitätsnahe Datensätze an. Die Trainer:innen demonstrieren die Vorgehensweise live, begleiten Sie bei der Bearbeitung der Aufgaben und geben Feedback zu Ihren Lösungen.

Hinweis

Hinweis

DDie Teilnehmer:innen benötigen für die Übungsaufgaben einen Laptop, auf dem Python und die benötigten Bibliotheken ausgeführt werden können. Wir empfehlen Ihnen daher, Ihren eigenen Laptop mit der vorab installierten Software mitzubringen. Eine genaue Installationsanleitung für die Software wird Ihnen vor dem Seminar per E-Mail zugesandt. Auf Anfrage stellen wir auch Schulungslaptops zur Verfügung.

Bitte prüfen Sie, ob Ihr Firmenlaptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript, Code, Dateien) werden im Seminar online zum Download zur Verfügung gestellt. Sie erhalten vor dem Seminar per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können. 

Sie sollten sich in firmenfremde WLAN-Netze registrieren können.

Als Backup-Lösung ist es hilfreich, wenn der USB-Port Ihres Laptops freigeschaltet ist, damit bei Bedarf Dateien über einen USB-Stick übertragen werden können.
Im Seminar wird das Betriebssystem Windows verwendet. Der Umgang mit Ihrem verwendeten Betriebssystem und Laptop sollte bekannt sein. Insbesondere sollten Sie ohne Schwierigkeiten Sonderzeichen auf der Tastatur finden (insbesondere bei Apple Geräten werden auf manchen Tastaturen nicht immer runde, eckige bzw. geschweifte Klammern dargestellt).

Hinweis für Online-Schulungen:
Für die Online-Teilnahme ist ein stabiler Internetzugang erforderlich. Wir empfehlen Ihnen, mit zwei Bildschirmen zu arbeiten, damit Sie die Präsentation und JupyterLab bzw. die Übungsumgebung parallel im Blick behalten können.

Häufig gestellte Fragen (FAQ)

Häufig gestellte Fragen (FAQ)

Für wen ist dieses Seminar geeignet?  
Das Seminar ist ideal für Fachkräfte wie Data Scientists, angehende Machine Learning Engineers, Datenanalystinnen und -analysten sowie Business Intelligence Analystinnen und Analysten, die ihre Python-Programmierkenntnisse für Data Science und Data Mining vertiefen möchten.

Wie viel Mathematik brauche ich für dieses Seminar?
Grundkenntnisse in Statistik und linearer Algebra sind hilfreich, aber es ist keine tiefgehende mathematische Ausbildung erforderlich. Wichtiger ist, dass Sie Begriffe wie Mittelwert, Varianz, Korrelation sowie grundlegende Funktionen und Vektoren einordnen können. Die mathematischen Hintergründe werden auf einem praxisorientierten Niveau erklärt, mit Fokus auf Verständnis und Interpretation der Modelle, nicht auf Herleitung aller Formeln.

Welche Python-Bibliotheken werden im Seminar verwendet?
Im Mittelpunkt steht scikit-learn als zentrale Bibliothek für Machine Learning. Ergänzend kommen u. a. NumPy und Pandas für Datenaufbereitung sowie Matplotlib bzw. Seaborn für Visualisierungen zum Einsatz. Für ausgewählte Themen können weitere Pakete genutzt werden, z. B. Statsmodels für detaillierte Modellanalysen.

Mit welcher Umgebung wird gearbeitet (z. B. JupyterLab)?
Im Seminar wird in der Regel mit Jupyter Notebooks bzw. JupyterLab gearbeitet. Diese Umgebung eignet sich sehr gut für interaktive Experimente, Schritt-für-Schritt-Demonstrationen und das Kommentieren von Code. Sie erhalten eine kurze Einführung in die Oberfläche, bevor Sie eigene Notebooks ausführen und bearbeiten.

Muss ich Python und alle Bibliotheken vor dem Seminar installieren?
Wenn Sie mit einem eigenen Laptop teilnehmen, ist es sinnvoll, Python und die benötigten Bibliotheken vorab zu installieren - z. B. über Anaconda oder eine vorbereitete virtuelle Umgebung. Sie erhalten rechtzeitig vor Seminarbeginn eine Anleitung mit den konkreten Installationsschritten und Paketversionen. Sofern eine lokale Installation nicht möglich ist, können nach Absprache alternative Lösungen (z. B. vorbereitete Umgebungen oder cloudbasierte Notebooks) eingesetzt werden.

Werden auch Themen wie Feature Engineering und Modellbewertung behandelt?
Ja, neben dem reinen Training von Modellen werden auch Schritte wie Datenaufbereitung, Feature Engineering, Evaluationsmetriken und Modellvergleich behandelt. 

Geht das Seminar auch auf Hyperparameter-Tuning ein?
Grundlagen des Hyperparameter-Tunings werden angesprochen. Der Schwerpunkt liegt darauf, das Prinzip zu verstehen, sinnvolle Parameterbereiche zu wählen und typische Stolpersteine zu erkennen. 

Eignet sich das Seminar als Einstieg in Machine Learning oder brauche ich Vorwissen?
Das Seminar ist als Einstieg in angewandtes Machine Learning mit Python konzipiert. Sie sollten Python-Grundkenntnisse mitbringen und einfache Datenanalysen in Python nachvollziehen können. Vorkenntnisse in Machine Learning sind nicht zwingend nötig; entsprechende Konzepte werden im Seminar eingeführt und anhand von Beispielen erarbeitet.

Welche nächsten Schritte empfehlen sich nach diesem Seminar?
Als nächste Schritte bieten sich vertiefende Seminare zu speziellen Machine-Learning-Themen an, z. B. Deep Learning, Natural Language Processing, Zeitreihenanalyse oder MLOps/Produktivsetzung von Modellen. Auch weiterführende Trainings zu Data Engineering, Datenplattformen oder statistischer Modellierung können sinnvoll sein, um Ihre Machine-Learning-Praxis systematisch auszubauen.

Termine

  • 1.300,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
  • 1.300,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
  • 1.300,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
  • 1.300,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    Cegos Integrata GmbH Düsseldorf
    Grafenberger Allee 293
    40237 Düsseldorf
  • 1.300,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
  • 1.300,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
Schulung - Machine Learning mit Python & Scikit Learn