Specialist Site Reliability Engineering (SRE) & Automation (m/w/d)
Rolle
Exzellenz im Betrieb ist kein Zufall, sondern das Ergebnis intelligenter Automatisierung. In dieser Rolle eliminierst du manuelle Aufwände und baust eine robuste, skalierbare Laufzeitumgebung für geschäftskritische Applikationen. Hier triffst du auf ein Umfeld, das technologische Tiefe und pragmatische Innovation schätzt.
Arbeitsort: Zürich oder Bern (flexible Homeoffice-Möglichkeiten)
Verantwortung
Next-Gen Deployment: Aufbau und Optimierung von CI/CD-Strecken mit GitLab zur Beschleunigung von Release-Zyklen.
System-Härtung: Kontinuierliche Modernisierung der bestehenden Linux-Plattform unter Einhaltung höchster Verfügbarkeitsansprüche.
Smart Automation: Entwicklung von Tools und Skripten in Python, um operative Risiken zu minimieren und die Konsistenz zu erhöhen.
Data Reliability: Verantwortung für die Integrität und Performance der PostgreSQL-Instanzen sowie der Objektspeicher-Lösungen.
Incident Management: Durchführung von Root-Cause-Analysen und Etablierung nachhaltiger Lösungen im Rahmen des Bereitschaftsdienstes.
Knowledge Engineering: Erstellung technischer Runbooks und Dokumentationen zur Sicherung der operativen Exzellenz.
Qualifikationen
Tiefgreifendes Verständnis für Linux-Infrastrukturen und deren Automatisierung.
Praktische Erfahrung in der Migration von monolithischen Diensten hin zu Microservices/Kubernetes.
Sicherer Umgang mit Artefakt-Management (Artifactory) und modernen Monitoring-Lösungen wie Zabbix.
Nachweisbare Erfolge in der Optimierung von Release-Prozessen in regulierten Branchen.
Fähigkeit, komplexe Netzwerk- und Sicherheitskonzepte (TLS, Zertifikatsmanagement) umzusetzen.
Souveräne Kommunikation in Englisch; ein klarer Fokus auf Stabilität und Skalierbarkeit.
Benefits