Beschreibung
Einführung in Predictive Modelling mit R
Die Teilnehmenden lernen die Grundlagen und fortgeschrittenen Techniken des Predictive Modelling mit R kennen. Das Seminar umfasst die Installation und Konfiguration von R und RStudio, Datenaufbereitung, Modellauswahl, Modelltraining, Zeitreihenanalyse, Clustering und NLP. Praktische Anwendungen und Best Practices helfen den Teilnehmenden, das Gelernte direkt umzusetzen.Kommende Starttermine
Inhalte / Module
- Einführung in Predictive Modelling und R
- Definition und Konzepte: Erklärung, was Predictive Modelling ist, seine Bedeutung und Anwendungsbereiche; Überblick über die Programmiersprache R und ihre Vorteile für Predictive Modelling.
- Einrichtung der Entwicklungsumgebung: Schritt-für-Schritt-Anleitung zur Installation und Konfiguration von R und RStudio; Einführung in die RStudio-Oberfläche und grundlegende Funktionen.
- Datenaufbereitung und Vorverarbeitung
- Datenerfassung und -bereinigung: Methoden zur Erfassung von Daten aus verschiedenen Quellen; Techniken zur Datenbereinigung, Umgang mit fehlenden Werten und Erkennung von Ausreißern.
- Feature Engineering: Erstellung neuer Features aus Rohdaten; Techniken wie Skalierung, Normalisierung und One-Hot-Encoding; Bedeutung von Feature Selection und Reduktion.
- Explorative Datenanalyse (EDA)
- Datenvisualisierung: Nutzung von ggplot2 und anderen Visualisierungsbibliotheken zur Darstellung von Verteilungen, Zusammenhängen und Trends in den Daten.
- Statistische Analyse: Durchführung statistischer Analysen zur Identifikation von Zusammenhängen und Mustern in den Daten; Berechnung von Kennzahlen wie Mittelwert, Median und Standardabweichung.
- Modellauswahl und -training
- Auswahl von ML-Algorithmen: Überblick über verschiedene Machine Learning-Algorithmen für Predictive Modelling, wie Lineare Regression, Entscheidungsbäume und KNN.
- Training und Validierung: Techniken zur Modelltraining und -validierung, einschließlich Hyperparameter-Optimierung und Kreuzvalidierung; Einführung in Caret und andere R-Pakete für Modelltraining.
- Modellbewertung und -optimierung
- Modellbewertung: Anwendung von Metriken zur Bewertung der Modellleistung, wie Genauigkeit, Präzision, Recall, F1-Score und ROC-AUC; Nutzung von Confusion Matrix zur Fehleranalyse.
- Modelloptimierung: Techniken zur Verbesserung der Modellleistung, wie Regularisierung, Feature-Selektionsverfahren und Ensemble-Methoden; Einführung in Boosting und Bagging.
- Zeitreihenanalyse und Prognosemodelle
- Datenvorbereitung für Zeitreihen: Vorbereitung von Zeitreihendaten für die Modellierung; Techniken wie Glättung, Differenzierung und Saisonalitätsanpassung.
- Erstellung und Bewertung von Prognosemodellen: Anwendung von Modellen wie ARIMA, Exponential Smoothing und Prophet zur Zeitreihenprognose; Bewertung der Modellleistung mit spezifischen Zeitreihenmetriken.
- Unüberwachtes Lernen und Clustering
- Clustering-Methoden: Einführung in Clustering-Algorithmen wie K-Means, DBSCAN und Hierarchical Clustering; Anwendung dieser Algorithmen zur Segmentierung von Daten.
- Dimensionalitätsreduktion: Nutzung von Techniken wie PCA (Principal Component Analysis) und t-SNE zur Reduktion der Datenkomplexität und Verbesserung der Modellinterpretierbarkeit.
- NLP und Textanalyse
- Vorverarbeitung von Textdaten: Techniken zur Tokenisierung, Stemming, Lemmatization und Entfernung von Stoppwörtern; Nutzung von R-Paketen wie tm und text2vec.
- Modellierung und Analyse: Anwendung von Methoden wie TF-IDF, Word2Vec und LDA zur Textklassifikation und -analyse; Implementierung und Bewertung von NLP-Modellen.
- Modell-Deployment und -Überwachung
- Modell-Deployment: Bereitstellung von ML-Modellen in Produktionsumgebungen; Nutzung von Tools wie Plumber für die Erstellung von R-APIs.
- Überwachung und Wartung: Implementierung von Überwachungsmechanismen zur Verfolgung der Modellleistung in der Produktion; Techniken zur Modellaktualisierung und -wartung.
- Praxisbeispiele und Best Practices
- Implementierung eines Predictive Modelling-Projekts: Durchführung eines Beispielprojekts zur Anwendung der erlernten Techniken und Methoden; Schritt-für-Schritt-Anleitung von der Planung bis zur Umsetzung.
- Erfahrungsberichte und Best Practices: Präsentation realer Fallstudien und Best Practices zur erfolgreichen Implementierung und Nutzung von Predictive Modelling mit R in verschiedenen Anwendungsbereichen.
Zielgruppe / Voraussetzungen
Hinweis: Dieser Kurs richtet sich an Mitarbeitende aus Unternehmen und Institutionen.
Für Privatpersonen ist dieser Kurs leider nicht geeignet.
Eine Informationsanfrage zu diesem Kurs ist nur für Beteiligte aus dem B2B-Bereich sinnvoll.
Abschlussqualifikation / Zertifikat
Infos anfordern
GFU Cyrus AG
Erweitern Sie Ihre IT-Skills mit einem offenen IT-Training oder ganz nach Ihren Bedürfnissen durch eine individuelle IT-Schulung. Programmiersprachen (C#, Python, Java, …), Microsoft Office 365, Anforderungsmanagement, Projektmanagement, Business Intelligence, Data Science, Künstliche Intelligenz, IT-Sicherheit , Administration & Datenbanken, Softwareentwicklung, Testmanagement...
Erfahren Sie mehr über GFU Cyrus AG und weitere Kurse des Anbieters.