Site Reliability Engineer (SRE) (m/w/d)
Verantwortung
Du konzipierst, betreibst und pflegst Entwicklungs-, Test- und Produktionssysteme in containerisierten Umgebungen (Docker, Kubernetes) und stellst deren stabilen Betrieb sicher.
In dieser Rolle automatisierst du Deployments und Konfigurations-Management und übernimmst neue oder geänderte Software gemeinsam mit den Entwicklungsteams in den operativen Betrieb.
Du stellst durch professionelles Monitoring, Logging und Alerting (z. B. mit Prometheus, Grafana) die Verfügbarkeit, Performance und Stabilität der Systeme sicher.
Du verantwortest Datensicherungen, Sicherheit, Compliance und Skalierbarkeit über alle Systemlandschaften hinweg.
Du analysierst Störungen in komplexen Umgebungen, behebst Fehler nachhaltig und pflegst die dazugehörige Betriebsdokumentation.
Du arbeitest eng mit Entwickler:innen zusammen und optimierst kontinuierlich Deployment- und Betriebsprozesse.
Qualifikationen
- Du verfügst über eine abgeschlossene Informatikausbildung und mehrjährige Praxis im DevOps- oder Systemadministrationsumfeld.
- Du hast fundierte Kenntnisse in Linux-Systemen, Cloud-Infrastrukturen und Container-Technologien.
- Du beherrschst Skriptsprachen wie Bash oder Python, arbeitest sicher mit Git und kennst Konfigurationsmanagement-Tools wie Puppet oder Ansible.
- Du besitzt ein solides Verständnis von Netzwerken sowie gängigen Security Best Practices.
- Du arbeitest selbstorganisiert und proaktiv und überzeugst durch ausgeprägte Problemlösungsfähigkeiten, Zuverlässigkeit und Verantwortungsbewusstsein.
- Du kommunizierst fliessend in Deutsch und verfügst über gute Englischkenntnisse.
Benefits