Name: Site Reliability Engineering
Brand: GFU Cyrus AG
SKU: 2005393

Beschreibung

Site Reliability Engineering

Zielgruppe: Nur für Unternehmen und Institutionen.
Die Teilnehmenden lernen die grundlegenden und fortgeschrittenen Techniken zur effizienten Nutzung von Site Reliability Engineering (SRE) kennen. Das Seminar umfasst die Einführung in SRE-Prinzipien, Einrichtung und Verwaltung von Überwachungs- und Incident Management-Systemen, Fehleranalyse und Leistungsoptimierung, Sicherheitsmanagement und Compliance, sowie die Förderung einer SRE-Kultur.
Teilnehmende werden in die Lage versetzt, effektive SRE-Praktiken umzusetzen und die Zuverlässigkeit und Skalierbarkeit ihrer Systeme zu verbessern. Durch die praxisorientierten Übungen und detaillierten Anleitungen erlangen sie die Fähigkeit, qualitativ hochwertige und zuverlässige Systeme zu entwickeln und zu verwalten, die in verschiedenen Bereichen wie Cloud-Computing, große verteilte Systeme und DevOps-Umgebungen eingesetzt werden können. Dies trägt zur Verbesserung der Systemstabilität und der Zufriedenheit der Endnutzer bei.
Site Reliability Engineering (SRE) ist ein moderner Ansatz, der Software-Engineering-Prinzipien auf den IT-Betrieb anwendet, um hoch zuverlässige und skalierbare Systeme zu entwickeln und zu betreiben. Durch die Kombination von Automatisierung, proaktiver Überwachung, klar definierten SLOs und einer Kultur der kontinuierlichen Verbesserung bietet SRE erhebliche Vorteile gegenüber traditionellen Betriebsmodellen. Es ergänzt und erweitert die Prinzipien von DevOps und Platform Engineering und stellt sicher, dass Systeme sowohl innovativ als auch stabil sind. Für Unternehmen, die hohe Anforderungen an die Zuverlässigkeit und Skalierbarkeit ihrer IT-Infrastrukturen haben, ist SRE eine wertvolle Disziplin, die zur Optimierung ihrer Betriebsprozesse beiträgt.

Kommende Starttermine

Wählen Sie aus 17 verfügbaren Startterminen

2 Januar, 2025

Präsenzkurs / vor Ort
Köln
Deutsch

/ Person

2 Januar, 2025

Online-Kurs / Fernlehrgang
Online-Kurs / Fernlehrgang
Deutsch

/ Person

5 Mai, 2025

Präsenzkurs / vor Ort
Köln
Deutsch

/ Person

5 Mai, 2025

Online-Kurs / Fernlehrgang
Online-Kurs / Fernlehrgang
Deutsch

/ Person

27 August, 2025

Präsenzkurs / vor Ort
Köln
Deutsch

/ Person

27 August, 2025

Online-Kurs / Fernlehrgang
Online-Kurs / Fernlehrgang
Deutsch

/ Person

3 November, 2025

Präsenzkurs / vor Ort
Köln
Deutsch

/ Person

3 November, 2025

Online-Kurs / Fernlehrgang
Online-Kurs / Fernlehrgang
Deutsch

/ Person

12 Februar, 2026

Präsenzkurs / vor Ort
Köln
Deutsch

/ Person

12 Februar, 2026

Online-Kurs / Fernlehrgang
Online-Kurs / Fernlehrgang
Deutsch

/ Person

21 Mai, 2026

Präsenzkurs / vor Ort
Köln
Deutsch

/ Person

21 Mai, 2026

Online-Kurs / Fernlehrgang
Online-Kurs / Fernlehrgang
Deutsch

/ Person

27 August, 2026

Präsenzkurs / vor Ort
Köln
Deutsch

/ Person

27 August, 2026

Online-Kurs / Fernlehrgang
Online-Kurs / Fernlehrgang
Deutsch

/ Person

12 November, 2026

Präsenzkurs / vor Ort
Köln
Deutsch

/ Person

12 November, 2026

Online-Kurs / Fernlehrgang
Online-Kurs / Fernlehrgang
Deutsch

/ Person

Inhouse-Schulung auf Anfrage

Inhouse-Schulung
Deutschland
Deutsch

Infos anfordern

Inhalte / Module

Einführung in Site Reliability Engineering (SRE)
- Überblick und Ziele: Was ist SRE und warum ist es wichtig? Historische Entwicklung und Hauptmerkmale.
- Prinzipien und Konzepte: Kerngedanken hinter SRE, Unterschiede zu traditionellen Operations- und DevOps-Ansätzen.
- Anwendungsbereiche: Typische Anwendungsbereiche und Szenarien, in denen SRE eingesetzt wird (z.B. große verteilte Systeme, Cloud-Umgebungen).
Grundlegende SRE-Prinzipien
- Service Level Objectives (SLOs) und Service Level Agreements (SLAs): Definition und Bedeutung.
- Error Budgets: Konzept und Anwendung von Error Budgets zur Verwaltung von Systemstabilität und Featureentwicklung.
- Reduzierung der operativen Last: Automatisierung, Toil-Reduzierung und Best Practices zur Effizienzsteigerung.
SRE-Tools und Technologien
- Überwachungs- und Logging-Tools: Einführung in gängige Überwachungs- und Logging-Tools (z.B. Prometheus, Grafana, ELK Stack).
- Incident Management: Tools und Prozesse zur Incident-Erkennung und -Behebung (z.B. PagerDuty, Opsgenie).
- Automatisierungs-Tools: Nutzung von Automatisierungs- und Konfigurationsmanagement-Tools (z.B. Ansible, Terraform).
Einrichtung einer SRE-Umgebung
- Infrastruktur als Code: Implementierung von Infrastructure as Code (IaC) für zuverlässige und wiederholbare Umgebungsbereitstellung.
- CI/CD-Pipelines: Aufbau und Verwaltung von Continuous Integration und Continuous Deployment Pipelines zur Automatisierung von Tests und Bereitstellungen.
- Sicherheitsaspekte: Einführung in Sicherheitsaspekte und Best Practices im SRE-Umfeld.
Praktische Übung 1: Einrichtung einer Überwachungs- und Incident Management-Lösung
- Problemstellung: Einrichtung einer Überwachungs- und Incident Management-Lösung für eine Beispielanwendung.
- Lösung: Installation und Konfiguration von Prometheus und Grafana zur Überwachung, Einrichtung von Incident Management-Tools wie PagerDuty.
- Ergebnis: Ein funktionierendes Überwachungs- und Incident Management-System für die Beispielanwendung.
Fehleranalyse und Fehlerbehebung
- Root Cause Analysis (RCA): Techniken zur Fehleranalyse und Ursachenfindung.
- Post-Mortem-Analysen: Erstellung und Nutzung von Post-Mortem-Berichten zur kontinuierlichen Verbesserung.
- Chaos Engineering: Einführung in Chaos Engineering und praktische Ansätze zur Implementierung.
Kapazitätsplanung und Leistungsoptimierung
- Kapazitätsplanung: Techniken und Tools zur effektiven Planung und Verwaltung der Systemkapazität.
- Leistungsoptimierung: Methoden zur Analyse und Optimierung der Systemleistung.
- Skalierbarkeit: Strategien zur Sicherstellung der Skalierbarkeit von Systemen und Anwendungen.
Sicherheit und Compliance im SRE
- Sicherheitsmanagement: Implementierung von Sicherheitsrichtlinien und Best Practices.
- Compliance: Einhaltung gesetzlicher Vorschriften und Industriestandards (z.B. GDPR, HIPAA).
- Incident Response: Planung und Durchführung von Sicherheitsvorfällen und Notfallwiederherstellung.
Kultur und Zusammenarbeit
- SRE-Kultur: Aufbau und Förderung einer SRE-Kultur innerhalb des Unternehmens.
- Zusammenarbeit zwischen Entwicklung und Betrieb: Methoden zur Förderung der Zusammenarbeit und Kommunikation zwischen Entwicklungsteams und SREs.
- Schulung und Weiterbildung: Strategien zur kontinuierlichen Weiterbildung und Schulung von SRE-Teams.
Praktische Übung 2: Implementierung eines vollständigen SRE-Projekts
- Problemstellung: Implementierung eines vollständigen SRE-Projekts zur Sicherstellung der Zuverlässigkeit und Skalierbarkeit einer Anwendung.
- Lösung: Anwendung der erlernten Techniken und Tools zur Überwachung, Fehlerbehebung, Kapazitätsplanung und Leistungsoptimierung.
- Ergebnis: Ein vollständiges SRE-Projekt, das die Zuverlässigkeit und Skalierbarkeit der Anwendung sicherstellt und eine Dokumentation der Implementierung und Ergebnisse.

Zielgruppe / Voraussetzungen

Dieses Seminar richtet sich an Site Reliability Engineers, DevOps-Ingenieure, Systemadministratoren, Softwareentwickler und IT-Experten, die ihre Kenntnisse in der Nutzung von SRE-Praktiken zur Verbesserung der Zuverlässigkeit und Skalierbarkeit ihrer Systeme erweitern möchten. Grundlegende Kenntnisse in Systemadministration, DevOps und Cloud-Computing sind hilfreich

Hinweis: Dieser Kurs richtet sich an Mitarbeitende aus Unternehmen und Institutionen.

Für Privatpersonen ist dieser Kurs leider nicht geeignet.

Bitte beachten Sie: Bildungsgutscheine der Agentur für Arbeit werden für diesen Kurs NICHT anerkannt.

Abschlussqualifikation / Zertifikat

Teilnahmezertifikat und digitales Badge

Infos anfordern

Stellen Sie jetzt eine Informationsanfrage

Kontaktieren Sie hier den Anbieter, um mehr über das Kursangebot Site Reliability Engineering zu erfahren!

Sie erhalten weitere Infos

Unverbindlich

Kostenfrei

Ja, ich möchte den Newsletter von kursfinder.de erhalten!

Bitte empfehlen Sie mir andere ähnliche Angebote. Eine Übersicht möglicher Anbieter finde ich hier: https://www.kursfinder.de/weiterbildungsanbieter-kursfinderde-23795 (optional)

Ja, ich akzeptiere die Allgemeinen Nutzungsbedingungen & Datenschutzregeln

Diese Webseite ist durch reCAPTCHA geschützt. Es gelten die Google Datenschutzbestimmungen und Nutzungsbedingungen.

GFU Cyrus AG

Am Grauen Stein 27

51105 Köln

+49221828090

www.gfu.net

Website des Anbieters

GFU Cyrus AG

Erweitern Sie Ihre IT-Skills mit einem offenen IT-Training oder ganz nach Ihren Bedürfnissen durch eine individuelle IT-Schulung. Programmiersprachen (C#, Python, Java, …), Microsoft Office 365, Anforderungsmanagement, Projektmanagement, Business Intelligence, Data Science, Künstliche Intelligenz, IT-Sicherheit , Administration & Datenbanken, Softwareentwicklung, Testmanagement...

Erfahren Sie mehr über GFU Cyrus AG und weitere Kurse des Anbieters.

Site Reliability Engineering

Ort

Beschreibung

Site Reliability Engineering

Kommende Starttermine

2 Januar, 2025

2 Januar, 2025

5 Mai, 2025

5 Mai, 2025

27 August, 2025

27 August, 2025

3 November, 2025

3 November, 2025

12 Februar, 2026

12 Februar, 2026

21 Mai, 2026

21 Mai, 2026

27 August, 2026

27 August, 2026

12 November, 2026

12 November, 2026

Inhouse-Schulung auf Anfrage

Kommende Starttermine

Inhalte / Module

Zielgruppe / Voraussetzungen

Abschlussqualifikation / Zertifikat

Infos anfordern

Stellen Sie jetzt eine Informationsanfrage

GFU Cyrus AG

Diese Kurse könnten Ihnen auch gefallen...

Vertiefung der Informationstechnologie (EDV)

Medieninformatik: IT-Recht

Projektmanagement für IT-Consultants

Knowhow-Transfer im IT-Alltag

IT-Grundlagen

Zertifiziertes Fachpersonal im IT-Support

IT-Grundschutz Praktiker (BSI)

IT Manager - Unternehmensarchitektur

IT Projektmanager