Full-Stack AI Engineer (DevOps / MLOps Focus)
Mô tả công việc
Tham gia phát triển dự án AI với vai trò Fullstack Engineer, trong đó thiên về hạ tầng và vận hành hệ thống AI.
Phát triển backend bằng Python cho các hệ thống AI:
RAG pipelines
Internal AI services
LLM inference
Triển khai và vận hành LLM inference services sử dụng vLLM trên môi trường local / private.
Phát triển frontend bằng Next.js cho các AI- powered web applications (dashboard, admin, internal tools).
Làm việc với các hệ thống dữ liệu:
Vector database (Qdrant)
PostgreSQL
Triển khai, vận hành và tối ưu hệ thống trên Kubernetes.
Đóng gói và triển khai hệ thống bằng Docker / Podman.
Tối ưu:
Resource usage (CPU, RAM, GPU)
Latency và throughput của LLM inference
GPU utilization
Xây dựng và duy trì CI/CD pipelines cho toàn bộ hệ thống (frontend, backend, AI services).
Thiết lập monitoring & observability cho hệ thống:
Service health
GPU metrics
Application metrics
Phối hợp với team AI để:
Triển khai RAG và các AI workflows
Tích hợp LLM, embedding models
Đảm bảo hệ thống ổn định, bảo mật và có khả năng mở rộng cho nhiều người dùng.
Yêu cầu công việc
Bắt buộc:
Tối thiểu 2 năm kinh nghiệm với vai trò Fullstack / Backend / Platform Engineer.
Thành thạo backend bằng Python (FastAPI, Flask hoặc tương đương).
Có kinh nghiệm frontend với Next.js (React).
Có kinh nghiệm thực tế với cả backend và frontend.
Đã từng làm việc với cơ sở dữ liệu:
Vector database (Qdrant hoặc tương đương).
PostgreSQL
Có kinh nghiệm triển khai AI/ML workloads, ưu tiên:
AI local / self- hosted.
vLLM
Kinh nghiệm containerization: Docker hoặc Podman.
Kinh nghiệm CI/CD (GitLab CI, Jenkins, GitHub Actions).
Kinh nghiệm triển khai và vận hành Kubernetes.
Thành thạo Linux, hiểu system troubleshooting và networking cơ bản.
Ưu tiên:
Đã từng sử dụng AI coding tools (Cursor AI, Claude Code).
Kinh nghiệm build các dự án AI
Triển khai hệ thống AI trong môi trường on- prem / offline / air- gapped.
Monitoring: Prometheus, Grafana, GPU metrics exporter.
Kỹ năng & tư duy:
Hiểu trade- off giữa performance, cost và độ ổn định.
Chủ động học công nghệ mới trong lĩnh vực AI/LLM.
Có khả năng debug các vấn đề liên quan đến GPU, latency, memory.
Giao tiếp tốt, phối hợp hiệu quả với team
Tư duy Fullstack nhưng hiểu sâu về DevOps / MLOps cho hệ thống AI.
Không ngại làm cả code ứng dụng lẫn hạ tầng.
Quyền lợi
Môi trường kỹ thuật mở, khuyến khích thử nghiệm và tối ưu hệ thống.
Được sử dụng AI tools trong quá trình phát triển (Cursor AI, Claude Code…).
Làm việc với AI local / private LLM infrastructure.
Tham gia trực tiếp các dự án AI thực tế, không phải demo.
Lộ trình phát triển:
AI Team Leader
Senior Fullstack AI Engineer
Lương thưởng hấp dẫn phù hợp với năng lực. Xét tăng lương 2 lần/năm (tháng 1,7)
Nhiều cơ hội đi công tác Nhật Bản.
Môi trường làm việc trẻ trung, thân thiện và vui vẻ.
Nhiều loại trợ cấp hấp dẫn (ăn trưa, đi lại, tiếng Nhật, thâm niên,…)
Đóng BHXH trên full lương. Khám sức khỏe định kỳ hằng năm.
Tham gia bảo hiểm sức khỏe PVI
Nghỉ thứ 7, chủ nhật.
Hoạt động nội bộ đa dạng: Happy hours hằng tháng. Team building hằng quý. Du lịch công ty hằng năm…Tổ chức nhiều hoạt động thể thao thú vị như: bóng bàn, bóng đá, cầu lông, marathon…
Trực tiếp làm việc với khách hàng Nhật Bản, nhiều cơ hội nâng cao khả năng ngôn ngữ và học hỏi thêm phong cách làm việc.
Tham gia lớp học tiếng Nhật trong giờ làm việc do công ty tổ chức. Hỗ trợ lệ phí thi tuyển các chứng chỉ như: BJT, JLPT…
Cập nhật gần nhất lúc: 2026-02-09 07:20:03

CUBE SYSTEM VIETNAM CO. LTD
Bí kíp tìm việc an toàn
Tiện ích hỗ trợ bạn
Việc làm đề xuất liên quan
Hiện tại chúng tôi chưa có việc làm đề xuất phù hợp với bạn.








