Full-Stack AI Engineer (DevOps / MLOps Focus)
Mô tả công việc
Tham gia phát triển dự án AI với vai trò Fullstack Engineer, trong đó thiên về hạ tầng và vận hành hệ thống AI.
Phát triển backend bằng Python cho các hệ thống AI:
Internal AI services
LLM inference
RAG pipelines
Phát triển frontend bằng Next.js cho các AI- powered web applications (dashboard, admin, internal tools).
Triển khai và vận hành LLM inference services sử dụng vLLM trên môi trường local / private.
Làm việc với các hệ thống dữ liệu:
Vector database (Qdrant)
PostgreSQL
Đóng gói và triển khai hệ thống bằng Docker / Podman.
Triển khai, vận hành và tối ưu hệ thống trên Kubernetes.
Tối ưu:
GPU utilization
Latency và throughput của LLM inference
Resource usage (CPU, RAM, GPU)
Xây dựng và duy trì CI/CD pipelines cho toàn bộ hệ thống (frontend, backend, AI services).
Thiết lập monitoring & observability cho hệ thống:
Application metrics
Service health
GPU metrics
Phối hợp với team AI để:
Triển khai RAG và các AI workflows
Tích hợp LLM, embedding models
Đảm bảo hệ thống ổn định, bảo mật và có khả năng mở rộng cho nhiều người dùng.
Yêu cầu công việc
Bắt buộc:
Tối thiểu 2 năm kinh nghiệm với vai trò Fullstack / Backend / Platform Engineer.
Thành thạo backend bằng Python (FastAPI, Flask hoặc tương đương).
Có kinh nghiệm thực tế với cả backend và frontend.
Có kinh nghiệm frontend với Next.js (React).
Đã từng làm việc với cơ sở dữ liệu:
Vector database (Qdrant hoặc tương đương).
PostgreSQL
Có kinh nghiệm triển khai AI/ML workloads, ưu tiên:
AI local / self- hosted.
vLLM
Kinh nghiệm triển khai và vận hành Kubernetes.
Kinh nghiệm CI/CD (GitLab CI, Jenkins, GitHub Actions).
Kinh nghiệm containerization: Docker hoặc Podman.
Thành thạo Linux, hiểu system troubleshooting và networking cơ bản.
Ưu tiên:
Triển khai hệ thống AI trong môi trường on- prem / offline / air- gapped.
Đã từng sử dụng AI coding tools (Cursor AI, Claude Code).
Monitoring: Prometheus, Grafana, GPU metrics exporter.
Kinh nghiệm build các dự án AI
Kỹ năng & tư duy:
Có khả năng debug các vấn đề liên quan đến GPU, latency, memory.
Tư duy Fullstack nhưng hiểu sâu về DevOps / MLOps cho hệ thống AI.
Giao tiếp tốt, phối hợp hiệu quả với team
Không ngại làm cả code ứng dụng lẫn hạ tầng.
Hiểu trade- off giữa performance, cost và độ ổn định.
Chủ động học công nghệ mới trong lĩnh vực AI/LLM.
Quyền lợi
Làm việc với AI local / private LLM infrastructure.
Môi trường kỹ thuật mở, khuyến khích thử nghiệm và tối ưu hệ thống.
Tham gia trực tiếp các dự án AI thực tế, không phải demo.
Được sử dụng AI tools trong quá trình phát triển (Cursor AI, Claude Code…).
Lộ trình phát triển:
Senior Fullstack AI Engineer
AI Team Leader
Nhiều loại trợ cấp hấp dẫn (ăn trưa, đi lại, tiếng Nhật, thâm niên,…)
Nhiều cơ hội đi công tác Nhật Bản.
Môi trường làm việc trẻ trung, thân thiện và vui vẻ.
Lương thưởng hấp dẫn phù hợp với năng lực. Xét tăng lương 2 lần/năm (tháng 1,7)
Tham gia bảo hiểm sức khỏe PVI
Đóng BHXH trên full lương. Khám sức khỏe định kỳ hằng năm.
Nghỉ thứ 7, chủ nhật.
Tham gia lớp học tiếng Nhật trong giờ làm việc do công ty tổ chức. Hỗ trợ lệ phí thi tuyển các chứng chỉ như: BJT, JLPT…
Trực tiếp làm việc với khách hàng Nhật Bản, nhiều cơ hội nâng cao khả năng ngôn ngữ và học hỏi thêm phong cách làm việc.
Hoạt động nội bộ đa dạng:Happy hours hằng tháng. Team building hằng quý. Du lịch công ty hằng năm…Tổ chức nhiều hoạt động thể thao thú vị như: bóng bàn, bóng đá, cầu lông, marathon…
Cập nhật gần nhất lúc: 2026-02-12 09:30:05

CÔNG TY TNHH CUBE SYSTEM VIỆT NAM ()
Bí kíp tìm việc an toàn
Tiện ích hỗ trợ bạn
Việc làm đề xuất liên quan
Hiện tại chúng tôi chưa có việc làm đề xuất phù hợp với bạn.








