Back to search:Site Reliability / Bandung

Kualifikasi :

  • Pengalaman 2–5 tahun di bidang SRE/DevOps/Infra Engineer.
  • Pengalaman dengan cloud platform (AWS, GCP, Azure) dan container orchestration (Kubernetes, Docker).
  • Penguasaan tools CI/CD (GitLab CI, Jenkins, GitHub Actions, ArgoCD).
  • Pengalaman dengan Infrastructure as Code (Terraform, Ansible, Helm).
  • Familiar dengan monitoring & logging tools (Prometheus, Grafana, ELK, OpenTelemetry).
  • Pemahaman database (MySQL, PostgreSQL, Redis, MongoDB) termasuk backup & high availability.
  • Keterampilan scripting/programming (Go, Python, Bash, atau sejenisnya).
  • Memiliki pengalaman dengan arsitektur microservices, familiar dengan security hardening dan secrets management serta
    pernah menerapkan konsep SLA/SLO/SLI di skala produksi menjadi nilai plus.
  • Bersedia ditempatkan di Kota Bandung.

Deskripsi Pekerjaan :

  • Menjaga ketersediaan, reliabilitas, dan performa sistem/aplikasi perusahaan.
  • Bekerjasama dengan tim Development dan Operations untuk membangun sistem yang otomatis, terukur, dan dapat diandalkan.
  • Menjamin layanan berjalan sesuai SLA, SLO, dan SLI.
  • Mengembangkan sistem monitoring, alerting, dan observability (Prometheus, Grafana, ELK, dsb).
  • Mengotomatiskan deployment, scaling, backup, dan recovery dengan CI/CD serta Infrastructure as Code (IaC).
  • Menangani insiden kritis, melakukan root cause analysis, dan menyusun blameless postmortem.
  • Melakukan capacity planning, load testing, dan performance tuning untuk memastikan sistem siap menghadapi pertumbuhan pengguna.
  • Menerapkan standar security, compliance, dan best practice DevOps.
  • Berkolaborasi dengan developer untuk membuat aplikasi yang resilient dan scalable.