Site Reliability Engineer (SRE)
Kraków (hybryda – 6 dni/miesiąc z biura)
O projekcie
Nasz Klient wspiera globalną organizację finansową przy rozwoju i utrzymaniu krytycznych systemów działających 24/7. To rola w międzynarodowym zespole DevOps, gdzie niezawodność, automatyzacja i skalowalność są kluczowe.
Będziesz mieć realny wpływ na stabilność usług, decyzje architektoniczne oraz kierunek rozwoju platform technologicznych.
Twoja rola
- Zapewnienie wysokiej dostępności i niezawodności systemów produkcyjnych (24/7)
- Wdrażanie rozwiązań zgodnych z praktykami SRE (monitoring, automatyzacja, optymalizacja)
- Analiza i rozwiązywanie incydentów + root cause analysis
- Udział w projektowaniu architektury systemów
- Definiowanie i monitorowanie SLI/SLO oraz rozwój observability
- Planowanie i realizacja migracji, upgrade’ów oraz testów disaster recovery
- Automatyzacja procesów i rozwój self-service dla użytkowników
- Wsparcie użytkowników i ciągłe ulepszanie doświadczenia końcowego
- Udział w dyżurach on-call (rotacyjnie)
- Udział w zaplanowanych pracach utrzymaniowych
Wymagania
- Min. 7 lat doświadczenia w SRE lub wsparciu aplikacji produkcyjnych
- Bardzo dobre umiejętności troubleshootingu i pracy pod presją
- Doświadczenie z narzędziami:
- Ansible
- Jenkins
- Prometheus
- Grafana
- Umiejętności programistyczne (full-stack), np.:
- Java / Python / JavaScript
- Node.js / React
- SQL
- Praktyczna znajomość SDLC
- Bardzo dobre umiejętności komunikacyjne i doświadczenie w pracy w środowisku międzynarodowym
Mile widziane
- Doświadczenie z Jira i Confluence (Data Center)
- Szybka adaptacja do nowych technologii i środowisk