Kurs suchen 👉

Site Reliability Engineering

GFU Cyrus AG, in Köln (+2 Standorte)
Dauer
2 Tage
Durchführungsform
Präsenzkurs / vor Ort, Online-Kurs / Fernlehrgang, Inhouse-Schulung
Nächster Starttermin
2 Januar, 2025 (+9 Starttermine)
Preis
1.370 EUR MwSt. befreit
Webseite des Anbieters
Sprache
Deutsch
Dauer
2 Tage
Durchführungsform
Präsenzkurs / vor Ort, Online-Kurs / Fernlehrgang, Inhouse-Schulung
Nächster Starttermin
2 Januar, 2025 (+9 Starttermine)
Preis
1.370 EUR MwSt. befreit
Webseite des Anbieters
Sprache
Deutsch
Ab 1.370 EUR MwSt. befreit / Person

Beschreibung

GFU Cyrus AG

Site Reliability Engineering

Die Teilnehmenden lernen die grundlegenden und fortgeschrittenen Techniken zur effizienten Nutzung von Site Reliability Engineering (SRE) kennen. Das Seminar umfasst die Einführung in SRE-Prinzipien, Einrichtung und Verwaltung von Überwachungs- und Incident Management-Systemen, Fehleranalyse und Leistungsoptimierung, Sicherheitsmanagement und Compliance, sowie die Förderung einer SRE-Kultur. 
Teilnehmende werden in die Lage versetzt, effektive SRE-Praktiken umzusetzen und die Zuverlässigkeit und Skalierbarkeit ihrer Systeme zu verbessern. Durch die praxisorientierten Übungen und detaillierten Anleitungen erlangen sie die Fähigkeit, qualitativ hochwertige und zuverlässige Systeme zu entwickeln und zu verwalten, die in verschiedenen Bereichen wie Cloud-Computing, große verteilte Systeme und DevOps-Umgebungen eingesetzt werden können. Dies trägt zur Verbesserung der Systemstabilität und der Zufriedenheit der Endnutzer bei.
Site Reliability Engineering (SRE) ist ein moderner Ansatz, der Software-Engineering-Prinzipien auf den IT-Betrieb anwendet, um hoch zuverlässige und skalierbare Systeme zu entwickeln und zu betreiben. Durch die Kombination von Automatisierung, proaktiver Überwachung, klar definierten SLOs und einer Kultur der kontinuierlichen Verbesserung bietet SRE erhebliche Vorteile gegenüber traditionellen Betriebsmodellen. Es ergänzt und erweitert die Prinzipien von DevOps und Platform Engineering und stellt sicher, dass Systeme sowohl innovativ als auch stabil sind. Für Unternehmen, die hohe Anforderungen an die Zuverlässigkeit und Skalierbarkeit ihrer IT-Infrastrukturen haben, ist SRE eine wertvolle Disziplin, die zur Optimierung ihrer Betriebsprozesse beiträgt.

Kommende Starttermine

Wählen Sie aus 9 verfügbaren Startterminen

2 Januar, 2025

  • Präsenzkurs / vor Ort
  • Köln
  • Deutsch

2 Januar, 2025

  • Online-Kurs / Fernlehrgang
  • Online-Kurs / Fernlehrgang
  • Deutsch

24 April, 2025

  • Präsenzkurs / vor Ort
  • Köln
  • Deutsch

24 April, 2025

  • Online-Kurs / Fernlehrgang
  • Online-Kurs / Fernlehrgang
  • Deutsch

27 August, 2025

  • Präsenzkurs / vor Ort
  • Köln
  • Deutsch

27 August, 2025

  • Online-Kurs / Fernlehrgang
  • Online-Kurs / Fernlehrgang
  • Deutsch

17 Dezember, 2025

  • Präsenzkurs / vor Ort
  • Köln
  • Deutsch

17 Dezember, 2025

  • Online-Kurs / Fernlehrgang
  • Online-Kurs / Fernlehrgang
  • Deutsch

Inhouse-Schulung auf Anfrage

  • Inhouse-Schulung
  • Deutschland
  • Deutsch

Inhalte / Module

  • Einführung in Site Reliability Engineering (SRE)
    • Überblick und Ziele: Was ist SRE und warum ist es wichtig? Historische Entwicklung und Hauptmerkmale.
    • Prinzipien und Konzepte: Kerngedanken hinter SRE, Unterschiede zu traditionellen Operations- und DevOps-Ansätzen.
    • Anwendungsbereiche: Typische Anwendungsbereiche und Szenarien, in denen SRE eingesetzt wird (z.B. große verteilte Systeme, Cloud-Umgebungen).
  • Grundlegende SRE-Prinzipien
    • Service Level Objectives (SLOs) und Service Level Agreements (SLAs): Definition und Bedeutung.
    • Error Budgets: Konzept und Anwendung von Error Budgets zur Verwaltung von Systemstabilität und Featureentwicklung.
    • Reduzierung der operativen Last: Automatisierung, Toil-Reduzierung und Best Practices zur Effizienzsteigerung.
  • SRE-Tools und Technologien
    • Überwachungs- und Logging-Tools: Einführung in gängige Überwachungs- und Logging-Tools (z.B. Prometheus, Grafana, ELK Stack).
    • Incident Management: Tools und Prozesse zur Incident-Erkennung und -Behebung (z.B. PagerDuty, Opsgenie).
    • Automatisierungs-Tools: Nutzung von Automatisierungs- und Konfigurationsmanagement-Tools (z.B. Ansible, Terraform).
  • Einrichtung einer SRE-Umgebung
    • Infrastruktur als Code: Implementierung von Infrastructure as Code (IaC) für zuverlässige und wiederholbare Umgebungsbereitstellung.
    • CI/CD-Pipelines: Aufbau und Verwaltung von Continuous Integration und Continuous Deployment Pipelines zur Automatisierung von Tests und Bereitstellungen.
    • Sicherheitsaspekte: Einführung in Sicherheitsaspekte und Best Practices im SRE-Umfeld.
  • Praktische Übung 1: Einrichtung einer Überwachungs- und Incident Management-Lösung
    • Problemstellung: Einrichtung einer Überwachungs- und Incident Management-Lösung für eine Beispielanwendung.
    • Lösung: Installation und Konfiguration von Prometheus und Grafana zur Überwachung, Einrichtung von Incident Management-Tools wie PagerDuty.
    • Ergebnis: Ein funktionierendes Überwachungs- und Incident Management-System für die Beispielanwendung.
  • Fehleranalyse und Fehlerbehebung
    • Root Cause Analysis (RCA): Techniken zur Fehleranalyse und Ursachenfindung.
    • Post-Mortem-Analysen: Erstellung und Nutzung von Post-Mortem-Berichten zur kontinuierlichen Verbesserung.
    • Chaos Engineering: Einführung in Chaos Engineering und praktische Ansätze zur Implementierung.
  • Kapazitätsplanung und Leistungsoptimierung
    • Kapazitätsplanung: Techniken und Tools zur effektiven Planung und Verwaltung der Systemkapazität.
    • Leistungsoptimierung: Methoden zur Analyse und Optimierung der Systemleistung.
    • Skalierbarkeit: Strategien zur Sicherstellung der Skalierbarkeit von Systemen und Anwendungen.
  • Sicherheit und Compliance im SRE
    • Sicherheitsmanagement: Implementierung von Sicherheitsrichtlinien und Best Practices.
    • Compliance: Einhaltung gesetzlicher Vorschriften und Industriestandards (z.B. GDPR, HIPAA).
    • Incident Response: Planung und Durchführung von Sicherheitsvorfällen und Notfallwiederherstellung.
  • Kultur und Zusammenarbeit
    • SRE-Kultur: Aufbau und Förderung einer SRE-Kultur innerhalb des Unternehmens.
    • Zusammenarbeit zwischen Entwicklung und Betrieb: Methoden zur Förderung der Zusammenarbeit und Kommunikation zwischen Entwicklungsteams und SREs.
    • Schulung und Weiterbildung: Strategien zur kontinuierlichen Weiterbildung und Schulung von SRE-Teams.
  • Praktische Übung 2: Implementierung eines vollständigen SRE-Projekts
    • Problemstellung: Implementierung eines vollständigen SRE-Projekts zur Sicherstellung der Zuverlässigkeit und Skalierbarkeit einer Anwendung.
    • Lösung: Anwendung der erlernten Techniken und Tools zur Überwachung, Fehlerbehebung, Kapazitätsplanung und Leistungsoptimierung.
    • Ergebnis: Ein vollständiges SRE-Projekt, das die Zuverlässigkeit und Skalierbarkeit der Anwendung sicherstellt und eine Dokumentation der Implementierung und Ergebnisse.

Zielgruppe / Voraussetzungen

Dieses Seminar richtet sich an Site Reliability Engineers, DevOps-Ingenieure, Systemadministratoren, Softwareentwickler und IT-Experten, die ihre Kenntnisse in der Nutzung von SRE-Praktiken zur Verbesserung der Zuverlässigkeit und Skalierbarkeit ihrer Systeme erweitern möchten. Grundlegende Kenntnisse in Systemadministration, DevOps und Cloud-Computing sind hilfreich

Hinweis: Dieser Kurs richtet sich an Mitarbeitende aus Unternehmen und Institutionen. 

Für Privatpersonen ist dieser Kurs leider nicht geeignet.

Eine Informationsanfrage zu diesem Kurs ist nur für Beteiligte aus dem B2B-Bereich sinnvoll.

Abschlussqualifikation / Zertifikat

Teilnahmezertifikat und digitales Badge

Infos anfordern

Stellen Sie jetzt eine Informationsanfrage

Kontaktieren Sie hier den Anbieter, um mehr über das Kursangebot Site Reliability Engineering zu erfahren!

  Sie erhalten weitere Infos

  Unverbindlich

  Kostenfrei


reCAPTCHA logo Diese Webseite ist durch reCAPTCHA geschützt. Es gelten die Google Datenschutzbestimmungen und Nutzungsbedingungen.
GFU Cyrus AG
Am Grauen Stein 27
51105 Köln

GFU Cyrus AG

Erweitern Sie Ihre IT-Skills mit einem offenen IT-Training oder ganz nach Ihren Bedürfnissen durch eine individuelle IT-Schulung. Programmiersprachen (C#, Python, Java, …), Microsoft Office 365, Anforderungsmanagement, Projektmanagement, Business Intelligence, Data Science, Künstliche Intelligenz, IT-Sicherheit , Administration & Datenbanken, Softwareentwicklung, Testmanagement...

Erfahren Sie mehr über GFU Cyrus AG und weitere Kurse des Anbieters.

Anzeige