Beschreibung
Dreitägiger Data Science Kurs mit der Programmiersprache Python für Datenanalyse und Data Science, sehr praxisorientiert:
- In der Schulung werden die Grundlagen von Python erläutert.
- Schwerpunkt der Schulung bildet das Python Modul pandas mit seinem DataFrame. Pandas ist das gängige Data Science Paket in Python.
- Darüberhinaus werden zur Generierung von Grafiken und Plots die Pakete seaborn und matplotlib erläutert.
- Erste Machine Learning Algorithmen (Entscheidungsbaum, K-Means Clustering/DBSCAN, Neuronales Netz) mit dem Python Paket scikit-learn geben einen Einblick in das Maschinelle Lernen.
Der dreitägige Data Science Kurs in Python für die Verwendung von Python für Data Science erklärt die notwendigen Grundlagen für die Datenanalyse und die Anwendung von Machine Learning Algorithmen. Bei den Algorithmen wird nur das notwendige theoretische Verständnis geschult, da das Ziel in der Schulung auf der praktischen Umsetzung der Algorithmen in Python mit dem Paket scikit-learn liegt. Am Ende des Seminars können Sie selbstständig erste Datenanalysen umsetzen und einfache Machine Learning Algorithmen für die Datenanalyse einsetzen.
Das Paket pandas ist ein Schwerpunkt dieser Data Science Schulung, da dieses Paket speziell für Data Science entwickelt wurde. Die wichtigsten Schritte für die Datenaufbereitung mit pandas werden eingeübt. Zur Erstellung von Plots und Grafiken wird im Kurs das Paket seaborn verwendet und eine kurze Einführung in matplotlib gegeben. Matplotlib überzeugt durch die Fülle an Möglichkeiten einen Plot anzupassen, seaborn durch die Einfachheit auch komplexere Plots mit wenig Code zu erstellen.
Nach den Grundlagen für Python (Datenstrukturen, eigene Funktionen schreiben) und der Erläuterung von pandas für die Auswertung von Daten, erhalten Sie einen Überblick über Machine Learning Algorithmen, welche wir in Python mit dem Paket scikit-learn selbst programmieren werden. Ein wichtiger Bestandteil vom Data Science Python Seminar ist das eigenständige Arbeiten und Lösen von Übungsaufgaben, so dass Sie mit direkter Hilfe des Trainers das Besprochene direkt in der Praxis umsetzen und so Schritt für Schritt die Anwendung von Data Science lernen können.
- In der Schulung werden die Grundlagen von Python erläutert.
- Schwerpunkt der Schulung bildet das Python Modul pandas mit seinem DataFrame. Pandas ist das gängige Data Science Paket in Python.
- Darüberhinaus werden zur Generierung von Grafiken und Plots die Pakete seaborn und matplotlib erläutert.
- Erste Machine Learning Algorithmen (Entscheidungsbaum, K-Means Clustering/DBSCAN, Neuronales Netz) mit dem Python Paket scikit-learn geben einen Einblick in das Maschinelle Lernen.
Der dreitägige Data Science Kurs in Python für die Verwendung von Python für Data Science erklärt die notwendigen Grundlagen für die Datenanalyse und die Anwendung von Machine Learning Algorithmen. Bei den Algorithmen wird nur das notwendige theoretische Verständnis geschult, da das Ziel in der Schulung auf der praktischen Umsetzung der Algorithmen in Python mit dem Paket scikit-learn liegt. Am Ende des Seminars können Sie selbstständig erste Datenanalysen umsetzen und einfache Machine Learning Algorithmen für die Datenanalyse einsetzen.
Das Paket pandas ist ein Schwerpunkt dieser Data Science Schulung, da dieses Paket speziell für Data Science entwickelt wurde. Die wichtigsten Schritte für die Datenaufbereitung mit pandas werden eingeübt. Zur Erstellung von Plots und Grafiken wird im Kurs das Paket seaborn verwendet und eine kurze Einführung in matplotlib gegeben. Matplotlib überzeugt durch die Fülle an Möglichkeiten einen Plot anzupassen, seaborn durch die Einfachheit auch komplexere Plots mit wenig Code zu erstellen.
Nach den Grundlagen für Python (Datenstrukturen, eigene Funktionen schreiben) und der Erläuterung von pandas für die Auswertung von Daten, erhalten Sie einen Überblick über Machine Learning Algorithmen, welche wir in Python mit dem Paket scikit-learn selbst programmieren werden. Ein wichtiger Bestandteil vom Data Science Python Seminar ist das eigenständige Arbeiten und Lösen von Übungsaufgaben, so dass Sie mit direkter Hilfe des Trainers das Besprochene direkt in der Praxis umsetzen und so Schritt für Schritt die Anwendung von Data Science lernen können.
Möchten Sie mehr über diese Weiterbildung erfahren?
Kommende Starttermine
1 verfügbarer Starttermin
Inhalte
Sie können eigene einfache Funktionen schreiben und kennen die Umsetzung von Control Flows (For-Schleife, If-Else). Sie verstehen das Grundkonzept eines pandas DataFrames und können damit Data Wrangling und Data Cleaning durchführen.
Die Einteilung von Machine Learning in supervised-unsupervised und Reinforcement Learning ist Ihnen bekannt und Sie können mit scikit-learn eigenständig Algorithmen in Python trainieren, validieren, einen Train-Test Datensplit durchführen und Gütekriterien zur Beurteilung eines Algorithmus berechnen und interpretieren. Bekannte Algorithmen im Machine Learning werden erläutert und Sie können die verschiedenen Algorithmen verstehen und in Python coden. Das Seminar umfasst Algorithmen für die Regression, Klassifikation und dem Clustering: Entscheidungsbaum, K-means clustering, DBSCAN Clustering, Multi-Layer-Perceptron und K-Nearest Neighbors.
Sie kennen die Data Science Grundlagen und die Einstiegshürde für die Benutzung von Python für Machine Learning ist genommen, so dass Sie eigenständig Ihr Wissen nach dem Data Science Seminar erweitern können. Der Schwerpunkt liegt auf der eigenen Umsetzung auf Ihrem Laptop mit Unterstützung des Dozenten.
Grundlagen von Python
- Neue Pakete installieren
- Jupyter Notebook als Entwicklungsumgebung/IDE
- Funktionen und Methoden
Das Paket pandas - DataFrame
- Struktur (Zeilen, Spalten) eines DataFrames
- Auswahl einer Zeile/Spalte
- Zeilen/Spalten erstellen, löschen, ändern
- Boolean indexing: eine logische Abfrage zur Selektion von Zeilen
- Daten zusammenfassen, um einen Überblick zu erhalten.
Berechnen von Statistiken direkt im pandas DataFrame
- Einfache Statistiken direkt auf einem DataFrame (Mittelwert, Min, Max, Summe, Median, Varianz,…)
- Zusammenfassen und Filtern von Daten
- Fehlende Werte ersetzen
- Kreuztabelle (Kontingenztafel)
Daten einlesen und schreiben
- Das Arbeitsverzeichnis in Python setzen
- Ein CSV bzw. Excel einlesen und schreiben
- Von einer URL einlesen
- Überblick über nützliche Parameter
- Lesen und Schreiben vom Python Format pickle
Control Flows
- Eine eigene Funktion schreiben
- Default Parameter in einer Funktion setzen: position arguments und keyword arguments
- For-Schleifen
- If-Else Bedingungen
Datenvisualisierung mit seaborn / matplotlib
- Die wichtigsten Grundlagen von matplotlib
- Achsen-Beschriftung, Legende, Titel ändern
- Einen Plot speichern
- In seaborn Linienplot, Boxplot, Histogram, Scatterplot, Barplot erstellen
- Darstellungen (Größe der Datenpunkte, Farbe, Gruppierung) mit einer Variable variieren oder festsetzen
String Manipulation im DataFrame; Grundlagen von numpy
- Text zeilenweise in einem DataFrame bearbeiten
- Informationen aus Text extrahieren
- Numpy arrays erstellen und nach Zeilen, Spalten slicen
- Funktionen in numpy auf ein array anwenden
Überblick über Machine Learning
- Einführung in Machine Learning
- Anwendungsbeispiele von Machine Learning
- Künstliche Intelligenz - Machine Learning - Deep Learning
- Unterschied Supervised - Unsupervised Learning (überwachtes - unüberwachtes Lernen)
- Overfitting und Train-Test-Split
Entscheidungsbaum mit scikit-learn
- Aufteilung der Daten in Test-Train, ein Model erstellen und validieren
- Grundlagen des Algorithmus
- Umsetzung in Python
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Anpassen von Hyperparametern im Training
Neuronales Netz; K-Nearest Neighbor
- Grundlagen des Algorithmus
- Ein Multi-Layer-Perceptron (MLP) trainieren
- Umsetzung in Python mit scikit-learn
- Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
- Anpassen von Hyperparametern
K-Means Clustering
- Ein Cluster-Model erstellen und validieren
- Grundlagen des Algorithmus
- Umsetzung in Python mit scikit-learn
- Validieren der Ergebnisse (Sillhouette Score, Calinski-Harabasz)
DBSCAN
- Wie funktioniert DBSCAN Clustering?
- Grundlagen des Algorithmus und Unterschiede zu K-Means
- Umsetzung in Python mit scikit-learn
- Validieren der Ergebnisse (Sillhouette Score, Calinski-Harabasz)
Voraussetzungen für die Python Data Scientist Weiterbildung
Um die Data Science Grundlagen in Python zu lernen, benötigen Sie keine Vorkenntnisse in Python. Jedoch sollten Sie über Grundkenntnisse in einer anderen Programmiersprache besitzen, damit bekannt ist, was eine Variable, eine Funktion bzw. eine for-Schleife ist.
Das Data Science Seminar beinhaltet Machine Learning Algorithmen, welche auf statistischen Verfahren aufbauen, wodurch grundlegende Kenntnisse der Statistik notwendig sind. Begriffe wie Mittelwert, Median, Standardabweichung oder Normalverteilung sollten Ihnen bekannt sein. Auch Symbole in der Mathematik, wie das Integral oder das Summenzeichen oder Begriffe der Mathematik, wie Funktion und Ableitung sind sehr empfohlen. Logische Operatoren Und-Oder-Nicht werden auch kurz verwendet.
Die Teilnehmer der Schulung sollten Vorerfahrung mit dem Umgang von Daten haben, z.B. in Excel oder einer BI-Software, damit Konzepte einer spaltenweisen Berechnung bzw. einfache Statistiken (Mittelwert, Varianz) bekannt sind.
Unterrichtssprache ist Deutsch. Die Folien sind auf Englisch, da Python und die Dokumentation der Pakete sowie Fachbegriffe des Machine Learnings auf Englisch sind. Ein englischer Text sollte daher verstanden werden, um der Schulung folgen zu können.
Technik im Data Science mit Python Kurs
- Die Teilnehmer benötigen für die Übungsaufgaben Laptops. Wir empfehlen, Ihren eigenen Laptop mit der vorab installierten Software mitzubringen. Eine genaue Installationsanleitung für die Software wird Ihnen vor dem Seminar per E-mail zugesandt. Auf Anfrage stellen wir auch Schulungslaptops zur Verfügung.
- Bitte prüfen Sie, ob Ihr Firmenlaptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript, Code, Dateien) werden im Kurs online zum Download zur Verfügung gestellt. Sie erhalten vor der Schulung per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können.
- Sie sollten sich in firmenfremde WLAN-Netze registrieren können.
- Als Backup Lösung ist es möglich, dass der USB Port bei Ihrem Laptop freigeschalten ist, um damit im Seminar verwendete Dateien oder sonstige Unterlagen übertragen zu können.
- In der Schulung wird das Betriebssystem Windows verwendet. Der Umgang mit Ihrem verwendeten Betriebssystem und Laptop sollte bekannt sein. Insbesondere sollten Sie ohne Schwierigkeiten Sonderzeichen auf der Tastatur finden (insbesondere bei Apple Geräten werden auf manchen Tastaturen nicht immer runde, eckige bzw. geschweifte Klammern dargestellt).
Hinweis
Das Online-Seminar wird über die E-Learningplattform von Enable AI bereitgestellt. Zur Einrichtung des User-Accounts und Zusendung von Zugangsdaten und Nutzung der Lernplattform übermitteln wir Name, Anschrift, Emailadresse der Teilnehmer an Enable AI. In diesem Zusammenhang wird auch die Telefonnummer zur Klärung der technischen Fragen übermittelt.
Teilnehmerkreis
Der Python Data Science Kurs ist ideal für Teilnehmer, welche die Anwendung von Python erlernen möchten, um Daten zu analysieren und Machine Learning Algorithmen zu programmieren. Angesprochen sind Anwender, welche die Data Science Grundlagen lernen möchten.
Unterrichtszeiten
Kostenzusatz
Infos anfordern
IHK-Zentrum für Weiterbildung Heilbronn GmbH
Ferdinand-Braun-Str. 20
74074 Heilbronn
IHK-Zentrum für Weiterbildung Heilbronn GmbH
Das IHK-Zentrum für Weiterbildung in Heilbronn versteht sich als Motor und Impulsgeber für den Erfolg der heimischen Wirtschaft. Alle Interessierten, seien es Unternehmen oder private Bildungsinteressenten, wollen wir durch unsere Angebote persönlich und berufsbezogen in ihrer Entwicklung unterstützen, um die...
Erfahren Sie mehr über IHK-Zentrum für Weiterbildung Heilbronn GmbH und weitere Kurse des Anbieters.
Anzeige