Site Reliability Engineer (SRE) (m/w/d)

Ändere mit uns die Servicewelt und lass uns gemeinsam Unternehmen durch bessere Workflows, bessere Zusammenarbeit und besseren Informationsfluss begeistern! USU ist der führende Anbieter von Software- und Servicelösungen für IT & Customer Service Management. Es erwarten Dich mehr als 750 tolle Kolleg:innen an 17 Standorten in vielen Ländern, die sich darauf freuen, zusammen mit Dir Maßstäbe für eine bessere Servicewelt zu setzen.

Bist du bereit, die Performance und Verfügbarkeit unserer geschäftskritischen Anwendungen zu sichern? In dieser Rolle arbeitest du eng mit unserem Plattform-Team zusammen, um robuste Monitoring- und Logging-Systeme zu entwickeln und CI/CD-Pipelines zu optimieren. Werde Teil unseres Teams und automatisiere Infrastrukturprozesse, während du nachhaltige Lösungen für technische Herausforderungen implementierst!

Gemeinsam begeistern wir unsere Kunden für eine bessere Servicewelt. Join us now!

Wir haben spannende Aufgaben für Dich:

  • Sicherstellung der Verfügbarkeit, Skalierbarkeit und Performance unserer verteilten Systeme und geschäftskritischen Anwendungen.
  • Einführung eines detaillierten Measurings zur Förderung der Transparenz.
  • Zusammenarbeit mit unserem Plattform-Team an der Entwicklung und Implementierung robuster Monitoring-, Logging- und Alerting-Systeme, z. B. auf Basis von Prometheus, Grafana und ELK-Stack.
  • Optimierung von CI/CD-Pipelines unter Verwendung von Tools wie Jenkins, GitLab CI oder ArgoCD.
  • Automatisierung von Infrastrukturprozessen mit Infrastructure-as-Code-Tools wie Terraform oder Ansible.
  • Durchführung von Root Cause Analysen und Implementierung nachhaltiger Lösungen für wiederkehrende Probleme.
  • Entwicklung und Umsetzung von Kapazitätsplanungen, Skalierungsstrategien und Disaster-Recovery-Plänen.
  • Mitarbeit an der Entwicklung von Self-Healing-Mechanismen und Optimierung des Deployment-Prozesses.

Das bringst Du mit:

  • Abgeschlossenes Studium in Informatik, Software-Engineering oder eine vergleichbare Qualifikation.
  • Mehrere Jahre Arbeitserfahrung als SRE .
  • Tiefgehende Kenntnisse in der Administration von Linux-Systemen (z. B. Ubuntu, CentOS, RHEL) und deren Netzwerkstack.
  • Erfahrung in der Entwicklung von Automatisierungsskripten und Tools mit Sprachen wie Go, Python oder Bash.
  • Fundierte Kenntnisse in Container-Technologien (Docker) und Container-Orchestrierung (Kubernetes).
  • Erfahrung mit modernen Observability-Ansätzen und Tools zur proaktiven Überwachung von Systemen.
  • Kenntnisse in dem Härten von Systemen und Sicherheitsaspekten wie IAM, Secret Management und Verschlüsselung.
  • Bewährte Fähigkeiten im Umgang mit Versionskontrollsystemen wie Git und Kollaboration in agilen Teams.

Unsere Benefits:

  • Individuelle Weiterbildung im Weiterbildungsprogramm U Step Up!
  • Pat:innenprogramm und individueller Einarbeitungsplan für neue Mitarbeitende sowie eine Einführungsveranstaltung
  • Flexible Arbeitszeiten, Sabbaticals, offene Türen und flache Hierarchien
  • 30 Tage Urlaub jährlich + diverse Sonderurlaube
  • Unterstützung bei der Berufsunfähigkeitsabsicherung
  • Unfallversicherung
  • Vergünstigte Mitgliedschaft im Firmenfitness Programm
  • Prämien für die Werbung neuer Mitarbeitender
  • Mitarbeitendenrabatte
  • USU-Bistro mit vergünstigtem Mittagessensangebot
  • Parkgarage und Ladestationen für Elektrofahrzeuge
  • Kostenloses Wasser, Kaffee, Tee & Obst
  • Partnerschaftliches Miteinander