Team Lead Site Reliability Engineering (SRE)
Kraków | Model hybrydowy
O stanowisku
Poszukujemy doświadczonego Team Leada Site Reliability Engineering, który obejmie odpowiedzialność za rozwój i prowadzenie zespołu SRE wspierającego krytyczne usługi IT oraz platformy biznesowe o globalnym zasięgu.
Osoba na tym stanowisku będzie odpowiadać za zarządzanie całym cyklem realizacji zadań zespołu – od przyjmowania i priorytetyzacji zgłoszeń, przez planowanie i realizację prac, aż po raportowanie wyników. Będzie również wyznaczać kierunek techniczny, wdrażać najlepsze praktyki inżynierskie oraz budować kulturę ciągłego doskonalenia.
Stanowisko wymaga ścisłej współpracy z architektami, Product Ownerami, zespołami produktowymi oraz operacyjnymi w celu zwiększania niezawodności, wydajności, skalowalności i bezpieczeństwa kluczowych usług IT.
Zakres obowiązków
- Zarządzanie zespołem Site Reliability Engineering odpowiedzialnym za utrzymanie i rozwój krytycznych usług oraz platform wspieranych przez dostawców zewnętrznych.
- Odpowiedzialność za pełny proces realizacji prac zespołu: od przyjmowania zgłoszeń, przez ich priorytetyzację, po dostarczenie rezultatów i raportowanie.
- Współpraca z Product Ownerami przy definiowaniu i wdrażaniu wskaźników niezawodności (SLO, SLI, SLA).
- Wspieranie zespołów produktowych we wdrażaniu najlepszych praktyk SRE i niezawodności w całym cyklu życia oprogramowania.
- Rozwijanie obszaru monitoringu i obserwowalności systemów oraz wdrażanie narzędzi zwiększających niezawodność i efektywność operacyjną.
- Definiowanie oraz egzekwowanie standardów inżynierskich i operacyjnych, obejmujących dokumentację, code review, kontrolę jakości i procedury operacyjne.
- Mentoring, coaching i rozwój kompetencji członków zespołu.
- Budowanie kultury ciągłego doskonalenia oraz wysokiej jakości dostarczanych rozwiązań.
- Analiza wyników i wdrażanie usprawnień wpływających na efektywność zespołu i stabilność środowisk produkcyjnych.
Wymagania
Must have
- Minimum 3 lata doświadczenia w zarządzaniu zespołami inżynierskimi oraz wyznaczaniu kierunku technicznego w środowisku korporacyjnym.
- Udokumentowane doświadczenie w budowaniu lub transformacji zespołów w wysokowydajne organizacje SRE lub Engineering.
- Bardzo dobra znajomość automatyzacji oraz języków skryptowych/programistycznych (Python, Go, Bash lub podobnych).
- Doświadczenie z procesami CI/CD.
- Praktyczna znajomość narzędzi monitoringu i observability, takich jak Grafana, Splunk, AppDynamics, OpenTelemetry lub podobnych.
- Doświadczenie w utrzymaniu systemów o wysokiej dostępności i niskich opóźnieniach w środowiskach regulowanych (np. sektor finansowy, fintech, ubezpieczenia).
- Silne umiejętności analityczne i rozwiązywania problemów.
- Bardzo dobra znajomość języka angielskiego w mowie i piśmie.
- Doświadczenie w pracy zgodnie z metodykami Agile.
- Umiejętność samodzielnej pracy oraz efektywnej współpracy w międzynarodowym środowisku.
- Wysoko rozwinięte umiejętności komunikacyjne, dokumentacyjne oraz poczucie odpowiedzialności za dostarczane rozwiązania.
Mile widziane
- Doświadczenie w utrzymaniu i rozwoju usług IT opartych o rozwiązania dostawców zewnętrznych.
- Znajomość zagadnień związanych z compliance, zarządzaniem ryzykiem oraz regulacjami obowiązującymi w sektorze usług finansowych.
Co oferujemy
- Możliwość realnego wpływu na rozwój i strategię obszaru Site Reliability Engineering.
- Pracę przy krytycznych systemach o dużej skali i wysokich wymaganiach dotyczących dostępności.
- Współpracę z międzynarodowymi zespołami ekspertów.
- Środowisko nastawione na rozwój technologiczny, automatyzację i ciągłe doskonalenie.
- Atrakcyjne warunki zatrudnienia oraz możliwość rozwoju kariery w organizacji o globalnym zasięgu.
- Benefity: LuxMed, MyBenefit