Deskripsi Kerja:
- Merancang dan mengimplementasikan solusi high availability untuk modern infrastructure, private/hybrid cloud, dan data services.
- Menjaga dan meningkatkan time to resolve incidents melalui peningkatan observability system dan proses incident management.
- Menulis kode yang bersih, berkualitas tinggi, dan maintainable untuk mengotomatisasi proses operasional.
- Meningkatkan keandalan sistem melalui performance testing dan praktik chaos engineering.
- Memimpin berbagai inisiatif seperti integrasi sistem baru, migrasi platform, dan pemenuhan kebutuhan compliance.
Kualifikasi:
- Minimal S1 di bidang Computer Science, Engineering, atau bidang terkait.
- Memiliki pengalaman kerja total 2+ tahun sebagai System Engineer dan 1+ tahun sebagai SRE/DevOps.
- Mahir dalam salah satu bahasa pemrograman:
Bash, Python, atau Go (Golang)
. - Pemahaman mendalam terkait
Operating System (Windows & Linux), Computer Networking, dan System Architecture
. - Berpengalaman dalam
Cloud Platform
(major providers) serta
On-Premises environment
. - Berpengalaman dengan
CI/CD development & integration
menggunakan GitLab, Jenkins, Azure DevOps, dll. - Berpengalaman menggunakan
automation tools
(contoh: Ansible). - Memahami konsep
DNS, load balancer, firewall, NAT, dan User Directory Service
. - Familiar dengan
container & orchestration
(misalnya Kubernetes) dan teknologi pendukungnya. - Familiar dengan teknologi lain seperti
storage, MQ, cache, Elasticsearch, dll. - Menguasai database yang umum digunakan (
MySQL, PostgreSQL
). - Familiar dengan
observability system
(metrics, logging, tracing, profiling). Pengalaman menggunakan
Prometheus & Grafana
menjadi nilai tambah. - Memiliki passion dalam membangun sistem yang high availability & performant serta peduli pada user experience.
- Responsif dalam menangani insiden sistem.
- Teliti, detail-oriented, memiliki kemampuan
critical thinking, data analytics, dan problem-solving
yang kuat. - Mampu berkomunikasi efektif dalam bahasa Inggris, baik lisan maupun tulisan.