Nhân Viên DevOps Engineer – Hệ Thống Kubernetes
Mô tả công việc
Quản lý dịch vụ backend portal (viết bằng Python): tiếp nhận source code, fix bug, deploy, tối ưu vận hành...
Thiết lập và vận hành hệ thống giám sát: Prometheus, Grafana, AlertManager, Logging (Loki, ELK...)
Security: scan image container, apply security policy (network policy, RBAC), quản lý truy cập
Thiết lập, quản lý và giám sát CI/CD pipeline
Thực hiện backup/restore dữ liệu: database (Postgres, MySQL), persistent volume...
Hỗ trợ khách hàng sử dụng cluster: hướng dẫn, xử lý sự cố, giải thích về kiến trúc, các best practices...
Viết kịch bản tự động (bash, python) hỗ trợ vận hành hạ tầng (scale, upgrade, provision...)
Vận hành, duy trì và tối ưu các cluster K8s (trên openstack)
Thiết lập Helm Charts, quản lý các values, triển khai các ứng dụng multi- tenancy
Thiết lập và quản lý secrets (Vault, ExternalSecrets, ...)
Tài liệu hóa quy trình DevOps và vận hành (runbook, hướng dẫn khách hàng...)
Quản lý storage: PVC/PV, StorageClass, mở rộng, snapshot...
Yêu cầu công việc
Tiêu chuẩn chuyên môn
Nền tảng hệ thống & mạng
Hiểu vững
Linux
(Ubuntu/CentOS/Alma...):
quản lý process, service, log, quyền, cron, systemd
xử lý sự cố CPU/RAM/disk, I/O, load average
Scripting (bash/python)
Nắm cơ bản network: TCP/IP, DNS, HTTP/HTTPS, reverse proxy, LB, firewall (iptables/security group...).
Docker & Container
Biết
Docker
best practice: giảm kích thước image, multi- stage build, bảo mật.
build/push image lên registry (Docker Hub / Harbor / ECR / GitLab Registry...)
viết & tối ưu Dockerfile
Kubernetes (bắt buộc)
Có kiến thức và kinh nghiệm tốt với:
Biết deploy ứng dụng lên K8s bằng:
Kinh nghiệm:
Pod, Deployment, StatefulSet, DaemonSet
debug pod (kubectl logs, describe, exec...)
Namespace, RBAC, ResourceQuota, HPA.
scale up/down, rolling update, rollback
YAML thuần hoặc Helm (ưu tiên Helm/ArgoCD/Kustomize).
Hiểu cách hoạt động của OpenStack (Nova, Cinder, Networking); Ưu tiên nếu đã làm việc với Magnum hoặc OpenStack COE
xử lý sự cố common: CrashLoopBackOff, ImagePullBackOff, OOMKilled...
Quản lý storage: PVC/PV, storageClass, volume extend
Service, Ingress, ConfigMap, Secret
CI/CD & Git
Biết dùng Git thành thạo (branching, MR/PR, code review).
Đã từng setup/maintain CI/CD với một trong các tool:
Tiêu chí:
GitLab CI, GitHub Actions, Jenkins, ArgoCD, Drone...
Biết rollback nhanh khi pipeline fail.
Tự động build, test, scan, build image, deploy lên K8s.
Monitoring – Logging – Alert
Có kinh nghiệm với
một stack giám sát
Biết:
đọc log, trace để điều tra sự cố.
đặt metrics, alert cơ bản (CPU, RAM, error rate, latency, disk, pod restart...)
Prometheus + Grafana / ELK / Loki / Zabbix / Datadog...
Cloud / Hạ tầng
Ít nhất biết một trong:
Hiểu các khái niệm:
VPC, subnet, SG, load balancer, object storage, block storage...
Cloud public: AWS / GCP / Azure (EC2, VPC, Load Balancer, RDS...)
backup & restore, snapshot, HA, DR (Disaster Recovery) là gì.
hoặc Private Cloud / Bare metal: OpenStack, Proxmox, VMWARE, on- prem.
Bảo mật
Nắm các nguyên tắc cơ bản:
Nếu tốt: hiểu thêm về NetworkPolicy, Service Mesh (Istio/Linkerd) là plus.
bảo mật secret, credential
least privilege (RBAC)
hardening OS & container, image scanning.
Python develop:
Packaging: Poetry/pipenv/venv
Đọc hiểu code Python (FastAPI/Flask/Django,,,)
Biết viết API, fix bug, xử lý những logic cơ bản.
Viết unit test cơ bản
Cấp độ từ Middle DevOps K8s trở lên
2–4 năm kinh nghiệm DevOps/SRE.
Biết tự thiết kế pipeline CI/CD → K8s, setup monitoring, logging.
Triển khai & vận hành ít nhất 1 hệ thống K8s thật (prod hoặc staging) với nhiều service.
Tiêu chuẩn thái độ, tư duy, tố chất
Tư duy SRE/DevOps
Chủ động & chịu áp lực
Tinh thần học hỏi
Giao tiếp & phối hợp
Ưu tiên đặc biệt:
ưu tiên tự động hóa thay vì làm tay
không “đổ lỗi” mà tìm nguyên nhân gốc (Root Cause Analysis).
K8s & DevOps thay đổi rất nhanh → cần cập nhật công nghệ liên tục.
coi “system reliability & uptime” là KPI chính.
làm việc được với developer, QA, khách hàng kỹ thuật.
Thông thạo lập trình Python
sẵn sàng xử lý sự cố hệ thống (on- call)
trình bày vấn đề rõ ràng, dễ hiểu (cả cho người không quá kỹ thuật).
Hồ sơ bao gồm:
- CV mô tả quá trình học tập, làm việc và kỹ năng có được
- Sơ yếu lý lịch + ảnh chân dung (bắt buộc)
Ghi chú:
Gdata sẽ hẹn phỏng vấn khi có thông tin đầy đủ
Quyền lợi
Thưởng tháng lương thứ 13 +
Đóng BHXH theo quy định, khám SK định kỳ, thưởng lễ tết, nghỉ mát, chế độ khác
Dải lương cứng: từ 20 – 30 triệu/ tháng
Cập nhật gần nhất lúc: 2025-11-23 12:25:03

CÔNG TY CỔ PHẦN DỮ LIỆU TOÀN CẦU
Bí kíp tìm việc an toàn
Tiện ích hỗ trợ bạn
Việc làm đề xuất liên quan
Hiện tại chúng tôi chưa có việc làm đề xuất phù hợp với bạn.








