Name: Data Engineering: Aufbau von Datenpipelines und ETL-Prozessen
Brand: GFU Cyrus AG
SKU: 1982725

Beschreibung

Data Engineering: Aufbau von Datenpipelines und ETL-Prozessen

Dieses Seminar bietet einen kompakten Überblick über die Grundlagen des Data Engineerings. Es beleuchtet zentrale Themen wie Datenintegration, ETL-Prozesse (Extraktion, Transformation, Laden) und Datenpipelines. Teilnehmer erhalten Einblick in verschiedene Datenmodelle und Datenbankarten, einschließlich relationaler und NoSQL-Systeme. Zudem werden praktische Fertigkeiten im Umgang mit relationalen Datenbanken und ETL-Tools vermittelt. Das Seminar behandelt auch fortgeschrittene Konzepte wie Datenpipeline-Architektur, Cloud-basierte Lösungen, Automatisierung, sowie Datenqualität und -sicherheit. Es richtet sich an Fachkräfte, die ihre Kenntnisse im Data Engineering vertiefen möchten.

Kommende Starttermine

Wählen Sie aus 7 verfügbaren Startterminen

2 Dezember, 2024

Präsenzkurs / vor Ort
Köln
Deutsch

/ Person

2 Dezember, 2024

Online-Kurs / Fernlehrgang
Online-Kurs / Fernlehrgang
Deutsch

/ Person

27 März, 2025

Präsenzkurs / vor Ort
Köln
Deutsch

/ Person

27 März, 2025

Online-Kurs / Fernlehrgang
Online-Kurs / Fernlehrgang
Deutsch

/ Person

22 Mai, 2025

Präsenzkurs / vor Ort
Köln
Deutsch

/ Person

22 Mai, 2025

Online-Kurs / Fernlehrgang
Online-Kurs / Fernlehrgang
Deutsch

/ Person

Inhouse-Schulung auf Anfrage

Inhouse-Schulung
Deutschland
Deutsch

Infos anfordern

Inhalte / Module

Grundlagen
- Was ist Data Engineering?
- Unterschied zwischen Datenintegration, Datenpipelines und ETL-Prozessen
- Wichtige Begriffe und Konzepte
Überblick über ETL-Prozesse
- Was bedeutet ETL (Extraktion, Transformation, Laden)?
- Wann und warum werden ETL-Prozesse benötigt?
Datenmodelle und Datenbanken
- Einführung in relationationale Datenbanken
- NoSQL Datenbanken und deren Relevanz im Data Engineering
- Datenmodellierung: Star-Schema, Snowflake-Schema, Denormalisierung
Praktische Übung : Erste Schritte mit einer relationalen Datenbank (z.B. PostgreSQL)
Extraktion von Daten
- Datenquellen und ihre Typen
- Tools und Techniken für die Datenextraktion
Transformation von Daten
- Bedeutung und Notwendigkeit der Datentransformation
- Typen von Transformationen
- Best Practices
ETL-Tools im Überblick
- Traditionelle ETL-Tools (z.B. Talend, Informatica)
- Open-Source-ETL-Tools (z.B. Apache NiFi, Apache Airflow)
Datenpipeline-Architektur
- Design-Prinzipien für skalierbare Pipelines
- Batch- vs. Echtzeitverarbeitung
- Best Practices für Fehlerbehandlung
- Leistungsoptimierungstechniken
Cloud-basierte Datenpipelines
- Vor- und Nachteile des Cloud-Computings
- Übersicht über Cloud-Anbieter: AWS, Google Cloud, Azure
- Migrationsstrategien: On-Premise zu Cloud
- Sicherheitsaspekte in der Cloud
Automatisierung und Orchestrierung
- Bedeutung der Automatisierung im Daten-Engineering
- Einführung in Orchestrierungstools: Apache Airflow, Prefect
- Automatisierungs-Workflow-Design
- Best Practices und Fallstricke
Datenpipelines für Advanced Analytics und ML
- Unterschied zwischen traditionellen Pipelines und ML-Pipelines
- Einführung in Feature Engineering
- ML-Model-Deployment und Inferenz-Pipelines
- Monitoring und Versionierung von ML-Modellen
Datenqualität und -bereinigung
- Wichtigkeit der Datenqualität
- Tools und Techniken zur Datenbereinigung
- Datenvalidierung und -überprüfung
- Fallstudien: Datenqualitätsprobleme und ihre Lösungen
Sicherheit in Datenpipelines
- Grundlagen der Datensicherheit
- Datenverschlüsselung und Maskierung
- Zugriffskontrolle und Authentifizierung
- Sicherheitsbedrohungen und ihre Abwehr
Daten-Governance und Compliance
- Was ist Daten-Governance?
- Rolle des Data Stewards
- Datenschutz-Grundverordnung (DSGVO) und andere Vorschriften
- Implementierung von Compliance-Maßnahmen
Monitoring und Fehlerbehandlung
- Überwachungstools und -strategien
- Fehlererkennung und -behebung
- Alarmierung und Benachrichtigungssysteme
- Rückverfolgbarkeit und Audit-Trails

Praktische Übung : Extraktion und Transformation von Daten mit einem ausgewählten ETL-Tool

Zielgruppe / Voraussetzungen

Am Seminar über den Aufbau von Datenpipelines und ETL-Prozessen sollten vor allem die folgenden Personen oder Rollen aus einem Unternehmen teilnehmen:

Dateningenieure : Sie sind häufig die Hauptverantwortlichen für die Gestaltung und Implementierung von Datenpipelines und würden daher direkt von den im Seminar vermittelten Fähigkeiten profitieren.
Datenanalysten : Obwohl sie sich hauptsächlich auf die Analyse von Daten konzentrieren, können Datenanalysten durch das Verständnis des ETL-Prozesses bessere Einblicke in die Herkunft und Qualität der Daten erhalten.
Business Intelligence (BI) Fachleute : Personen, die Dashboards und Berichte erstellen, sollten wissen, wie Daten verarbeitet und in Data Warehouses oder Datenlaken geladen werden.
Datenbankadministratoren (DBAs) : Ein Verständnis dafür, wie Daten extrahiert, transformiert und geladen werden, kann für DBAs nützlich sein, um die Performance und Integrität von Datenbanken sicherzustellen.
Projektmanager und Produktmanager : Sie müssen oft verschiedene Technikteams koordinieren und könnten von einem tieferen Verständnis der Datenintegrationsprojekte profitieren.

Hinweis: Dieser Kurs richtet sich an Mitarbeitende aus Unternehmen und Institutionen.

Für Privatpersonen ist dieser Kurs leider nicht geeignet.

Eine Informationsanfrage zu diesem Kurs ist nur für Beteiligte aus dem B2B-Bereich sinnvoll.

Abschlussqualifikation / Zertifikat

Teilnahmezertifikat und digitales Badge

Infos anfordern

Stellen Sie jetzt eine Informationsanfrage

Kontaktieren Sie hier den Anbieter, um mehr über das Kursangebot Data Engineering: Aufbau von Datenpipelines und ETL-Prozessen zu erfahren!

Sie erhalten weitere Infos

Unverbindlich

Kostenfrei

Ja, ich möchte den Newsletter von kursfinder.de erhalten! (optional)

Bitte empfehlen Sie mir andere ähnliche Angebote. Eine Übersicht möglicher Anbieter finde ich hier: https://www.kursfinder.de/weiterbildungsanbieter-kursfinderde-23795 (optional)

Ja, ich akzeptiere die Allgemeinen Nutzungsbedingungen & Datenschutzregeln

Diese Webseite ist durch reCAPTCHA geschützt. Es gelten die Google Datenschutzbestimmungen und Nutzungsbedingungen.

GFU Cyrus AG

Am Grauen Stein 27

51105 Köln

+49221828090

www.gfu.net

Website des Anbieters

GFU Cyrus AG

Erweitern Sie Ihre IT-Skills mit einem offenen IT-Training oder ganz nach Ihren Bedürfnissen durch eine individuelle IT-Schulung. Programmiersprachen (C#, Python, Java, …), Microsoft Office 365, Anforderungsmanagement, Projektmanagement, Business Intelligence, Data Science, Künstliche Intelligenz, IT-Sicherheit , Administration & Datenbanken, Softwareentwicklung, Testmanagement...

Erfahren Sie mehr über GFU Cyrus AG und weitere Kurse des Anbieters.

Azure - Implementieren einer Microsoft Azure Cosmos DB Lösung (ehemals MOC 20777)

SYMPLASSON Informationstechnik GmbH

Verschiedene (3)

1.917 EUR-2.130 EUR

Data Engineering: Aufbau von Datenpipelines und ETL-Prozessen

Ort

Beschreibung

Data Engineering: Aufbau von Datenpipelines und ETL-Prozessen

Kommende Starttermine

2 Dezember, 2024

2 Dezember, 2024

27 März, 2025

27 März, 2025

22 Mai, 2025

22 Mai, 2025

Inhouse-Schulung auf Anfrage

Kommende Starttermine

Inhalte / Module

Zielgruppe / Voraussetzungen

Abschlussqualifikation / Zertifikat

Infos anfordern

Stellen Sie jetzt eine Informationsanfrage

GFU Cyrus AG

Diese Kurse könnten Ihnen auch gefallen...

Big Data Grundlagen

Big Data Expert

MOC 20767 Implementierung eines Data-Warehouse mit Microsoft SQL Server

Datenmodellierung im Data Warehouse (Grundlagen)

Datenbanken und SQL Einführung: Datenhygiene, Datenaufbereitung und Abfragen

Big Data Experte/-in für die IT-Systemplanung

SQL ANSI/ISO Komplett inkl. fortgeschrittene Techniken

IT-System- und Datenanalyst:in

Azure - Implementieren einer Microsoft Azure Cosmos DB Lösung (ehemals MOC 20777)