Site Reliability / Platform Engineer (SRE) (m/w/d)
Rolle
Du möchtest nicht nur Infrastruktur betreiben, sondern Plattformen entwickeln, die zuverlässig skalieren und langfristig performant bleiben? In dieser Rolle gestaltest du moderne Cloud- und Plattformarchitekturen und sorgst dafür, dass Systeme stabil, transparent und effizient betrieben werden können. Du arbeitest eng mit Entwicklung, Security und Architekturteams zusammen und bringst Themen wie Observability, Automatisierung und Plattformstabilität aktiv voran.
Verantwortung
Konzeption und Weiterentwicklung zentraler Plattformfunktionen mit Fokus auf Skalierbarkeit und Stabilität
Aufbau und Optimierung von Monitoring-, Logging- und Alerting-Lösungen
Verwaltung und Optimierung von Netzwerk- und Connectivity-Lösungen in Cloud-Umgebungen
Planung und Weiterentwicklung performanter und effizienter Speicherlösungen
Umsetzung von Infrastructure-as-Code-Ansätzen und Automatisierungslösungen mit Terraform
Unterstützung des Betriebs sowie Incident- und Problem-Management
Zusammenarbeit mit Entwicklungs- und Plattformteams zur Bereitstellung stabiler Lösungen
Abstimmung mit Architektur- und Security-Teams zur Sicherstellung einer sicheren Plattformumgebung
Qualifikationen
Mehrjährige Erfahrung im Bereich Platform Engineering, Cloud Engineering oder System Engineering
Fundierte Kenntnisse in Azure, AWS oder Google Cloud Platform
Verständnis für verteilte Systeme und moderne Architekturprinzipien
Erfahrung mit Monitoring-, Logging- und Observability-Lösungen
Sehr gute Kenntnisse in Infrastructure-as-Code, insbesondere Terraform
Erfahrung mit Automatisierung, Testing und Versionsverwaltung
Selbstständige und strukturierte Arbeitsweise
Sehr gute Deutsch- und Englischkenntnisse
Benefits