Beschreibung
Ziele
Sie erlernen Performance Metriken und Annahmen von Modellen des Lernens mit sklearn anzuwenden. Darüber hinaus werden die Grundlagen des Storytellings und Best Practices der informativen Gestaltung von Visualisierungen mit bokeh Algorithmen des überwachten und unüberwachten Lernens, wie Entscheidungsbäume und Random Forests erlangt.
Zielgruppe
Inhalte
MODUL 0: PREPARATION
Data Analytics:Teilnehmende frischen die wichtigsten Grundlagen zur Datenverarbeitung mit Pandas, Datenvisualisierung mit Matplotlib und Seaborn und Datenbankabfrage mit SQL Alchemy auf.
Linear Algebra:Teilnehmende machen sich mit dem mathematischen Hintergrund von Data Science Algorithmen vertraut.
Probability Distributions:Teilnehmende erfahren mehr über den statistischen Hintergrund von Data Science Algorithmen.
MODUL 1: MACHINE LEARNING BASICS
Regression:Anhand der linearen Regression erlernen Teilnehmende den Umgang mit dem Python Paket sklearn.
Supervised Learning (Classification):Teilnehmende werden in Klassifizierungsalgorithmen eingeführt.
Clustering:Teilnehmende bekommen den k Means Algorithmus als Beispiel des unüberwachten Lernens vorgestellt.
Unsupervised Learning (Dimensionality Reduction):Teilnehmende erlernen, wie sie mithilfe einer Principal Component Analysis (PCA) die Dimension der Daten verringern können.
Outlier Detection:Teilnehmende bekommen Ansätze gezeigt, um Ausreißer zu identifizieren und verstehen.
MODUL 2: DEEP DIVE SUPERVISED LEARNING
Data Gathering:Teilnehmende erlernen, Daten zu sammeln.
Logistic Regression:Teilnehmende nutzen Performance Metriken zur Evaluation der Ergebnisse und erfahren, wie sie nichtnumerische Daten nutzbar machen.
Decision Trees and Random Forests:Teilnehmende lernen den Entscheidungsbaum als leicht zu interpretierendes Modell kennen.
Support Vector Machines:Teilnehmende lernen einen letzten Klassifizierungsalgorithmus.
Neural Networks:Teilnehmende werden in künstliche neuronale Netze eingeführt.
MODUL 3: ADVANCED TOPICS
Visualization and Model Interpretation:Teilnehmende erlernen Methoden zur Interpretation und Visualisierung von Machine Learning Modellen.
Spark:Teilnehmende erfahren, weshalb die Arbeit mit verteilten Speichersystemen relevant ist.
Exercise Project:Teilnehmende bearbeiten ein Prädiktionsproblem und setzen ihre Data Science Fähigkeiten eigenständig ein.
Final Project:Teilnehmende erhalten ein weiteres größeres Datenset, das sie selbstständig analysieren und lösen müssen.
Kommende Starttermine
Zielgruppe / Voraussetzungen
Hinweis
Sie lernen, Machine Learning Algorithmen zu implementieren und zu optimieren. Ebenso werden Kompetenzen aufgebaut für gängige Visualisierungsmethoden.
Hinweis
Voraussetzungen:
Teilnehmende sollten bereits gute Kenntnisse in Python im Umgang mit gängigen Modulen (pandas, matplotlib) mitbringen.
Infos anfordern
Die Unternehmensgruppe des Bildungswerks der Bayerischen Wirtschaft e. V.
Unter dem Dach des Bildungswerks der Bayerischen Wirtschaft e.V. hat sich ein Netzwerk von 18 Bildungsunternehmen, Sozial- und Personaldienstleistern mit flächendeckender Präsenz in Bayern entwickelt. Ihr innovatives Dienstleistungsportfolio in den Bereichen Bildung, Beratung, Personal und Soziales ist praxisnah und konsequent...