Site Reliability Engineer (Application SRE)
Mô tả công việc
Giám sát và Cảnh báo (Monitoring & Alerting): Thiết lập, quản lý hệ thống giám sát hiệu năng ứng dụng (APM), logs, metric và cấu hình cảnh báo thông minh để phát hiện sự cố sớm.
Phối hợp đội ngũ: Làm việc chặt chẽ với đội ngũ phát triển (Developers) để đảm bảo phần mềm dễ bảo trì, có khả năng mở rộng và ổn định ngay từ giai đoạn thiết kế.
Xử lý sự cố (Incident Management): Phản ứng nhanh, chẩn đoán nguyên nhân gốc rễ (Root Cause Analysis- RCA), khắc phục sự cố nghiêm trọng và tham gia xử lý sự cố trực (On- call).
Tối ưu hóa hiệu suất: Phân tích, đánh giá và cải thiện kiến trúc ứng dụng, tối ưu hóa hạ tầng để tăng khả năng mở rộng (scalability) và hiệu quả tài nguyên.
Đảm bảo độ tin cậy của ứng dụng: Xây dựng, giám sát và duy trì các hệ thống ứng dụng hoạt động ổn định, đạt các chỉ số SLO (Service Level Objectives), SLA (Service Level Agreements) và KPI của hệ thống
Tự động hóa vận hành: Viết mã (code/script) để tự động hóa các tác vụ thủ công, xây dựng công cụ CI/CD, tự động triển khai (deploy) và khôi phục hệ thống (automation).
Yêu cầu công việc
Có từ 2 năm kinh nghiệm ở vị trí tương đương.
Tốt nghiệp Đại học chuyên ngành: An toàn thông tin; Công nghệ thông tin, Khoa học máy tính, Toán – Tin…
Tư duy SRE: Hiểu biết về khái niệm độ tin cậy, SLO/SLI, quản lý rủi ro và khả năng chịu lỗi (fault tolerance).
Kỹ năng mềm: Khả năng giao tiếp tốt, tư duy phản biện, kỹ năng xử lý sự cố dưới áp lực cao và chủ động học hỏi.
Kỹ năng Coding/Scripting: Thành thạo ít nhất một ngôn ngữ lập trình (Python, Go, Java, Bash) để viết công cụ tự động hóa.
Công cụ Cloud/DevOps: Kinh nghiệm làm việc với các dịch vụ đám mây (AWS, Azure, GCP), Docker, Kubernetes, CI/CD tools (Jenkins, GitLab CI), và công cụ giám sát (Prometheus, Grafana, ELK stack). Kinh nghiệm làm việc với docker swarm, nomad/consul, k8s
Kiến thức hệ thống: Am hiểu sâu về Linux/Unix, mạng máy tính, cơ sở dữ liệu (SQL/NoSQL).
Quyền lợi
●Salary + Allowances:
- Đóng BHXH đầy đủ theo quy định, Bảo hiểm sức khỏe và tai nạn cá nhân của MIC (Hạn mức chi trả lên đến 600 triệu/năm)
- Khám sức khỏe định kỳ hàng năm
- Quà tết cho bản thân và gia đình.
- Giải thưởng nhân viên xuất sắc tháng/năm: 02- 10 triệu đồng
- Review lương định kỳ vào tháng 3 hàng năm
- 16 ngày nghỉ 1 năm (12 ngày nghỉ phép theo quy định Luật Lao động + 3 ngày nghỉ dưỡng + Ngày 22/12)
- Range lương: Offer theo gói tổng thu nhập năm theo năng lực
●Career Growth:
- Miễn phí tham gia các chương trình chia sẻ kiến thức chuyên ngành, các hội thảo chuyên môn từ các diễn giả đầu ngành trong nước và quốc tế
- Được tài trợ 100% đối với các chứng chỉ xếp hạng chuyên môn quốc tế chuyên sâu theo từng vị trí, Khen thưởng với CBNV đạt chứng chỉ chuyên môn quốc tế
- Liên tục đầu tư học liệu mới nhất, cập nhật nhất trên thị trường về lĩnh vực ATTT từ các nhà cung cấp, các học viện/uy tín hàng đầu thế giới
- 100% cán bộ nhân viên được cấp tài khoản Elearning từ Udemy- học thỏa sức mọi lúc mọi nơi
●Working Environment:
- Tham gia các event Công ty: hoạt động Teambuilding hàng quý, Sinh nhật hàng tháng, Year End Party, nghỉ mát, ngày lễ 08/03, 20/10 (các chị em được nghỉ ½ ngày), ngày sinh nhật tập đoàn 01/06, v.v
- Khu vực riêng dành cho Tập Gym, giải trí (chơi Bi- a, Pes, Bóng bàn, Café, Đọc sách…)
- Trang phục thoải mái, tự tin thể hiện cá tính
- Các CLB: Chạy, Cầu lông, Game, Bi lắc, Bơi, Sách…
- Thời gian làm việc linh hoạt (VCSer chọn giờ làm việc giữa 2 khung giờ sau 8h30- 18:00 hoặc 9h00- 18h30)
Cập nhật gần nhất lúc: 2026-03-05 05:55:02

CÔNG TY TNHH MỘT THÀNH VIÊN AN NINH MẠNG VIETTEL
Bí kíp tìm việc an toàn
Tiện ích hỗ trợ bạn
Việc làm đề xuất liên quan
Hiện tại chúng tôi chưa có việc làm đề xuất phù hợp với bạn.








