Data Engineer
Mô tả công việc
Chúng tôi đang tìm kiếm một Data Engineer tài năng để tham gia vào việc xây dựng hệ thống dữ liệu phục vụ huấn luyện các mô hình ngôn ngữ lớn (LLM), ứng dụng RAG (Retrieval- Augmented Generation), cũng như tối ưu các thuật toán tìm kiếm. Ứng viên sẽ chịu trách nhiệm xây dựng pipeline thu thập, xử lý, xác minh và lưu trữ dữ liệu có cấu trúc và phi cấu trúc từ nhiều nguồn khác nhau, đảm bảo tính sẵn sàng và chất lượng cho các bài toán AI.
Thiết kế và triển khai pipeline thu thập, xử lý và lưu trữ dữ liệu từ nhiều nguồn (file, API, database, crawling...).
Làm sạch, chuẩn hóa, và xác minh chất lượng dữ liệu, đặc biệt là các tập dữ liệu dùng để huấn luyện LLM hoặc tích hợp vào hệ thống RAG/search.
Đảm bảo dữ liệu tuân thủ các tiêu chuẩn bảo mật, quyền riêng tư và quy định liên quan.
Tối ưu hiệu năng các tác vụ xử lý dữ liệu và quản lý hệ thống lưu trữ (data lake, data warehouse...).
Phối hợp với các nhóm AI/ML Engineer, Data Scientist để cung cấp dữ liệu phục vụ huấn luyện và inference mô hình.
Hỗ trợ triển khai dữ liệu vào môi trường production cho các ứng dụng tìm kiếm thông minh, trợ lý ảo, hoặc mô hình ngôn ngữ.
Yêu cầu công việc
Năng lực chuyên môn
Hiểu rõ về kiến trúc hệ thống dữ liệu, pipeline ETL/ELT, và mô hình hóa dữ liệu.
Ưu tiên ứng viên có kinh nghiệm xử lý dữ liệu văn bản lớn phục vụ NLP, LLM.
Tốt nghiệp đại học chuyên ngành: Khoa học dữ liệu, Khoa học máy tính, Hệ thống thông tin, hoặc các ngành kỹ thuật liên quan.
Thành thạo công cụ xử lý dữ liệu như: Apache Spark, Airflow, Pandas, SQL, hoặc tương đương.
Kinh nghiệm
Kinh nghiệm với các hệ thống lưu trữ dữ liệu lớn
Tối thiểu 2 năm kinh nghiệm làm việc với vai trò Data Engineer hoặc trong lĩnh vực Khoa học dữ liệu.
Có kinh nghiệm tích hợp dữ liệu phục vụ các mô hình AI, đặc biệt là LLM (fine- tune, pretrain) hoặc RAG pipelines là một lợi thế.
Ưu tiên ứng viên có kinh nghiệm xây dựng hoặc hỗ trợ các hệ thống tìm kiếm (ElasticSearch, Vector DB như FAISS, Weaviate, Pinecone...).
Quyền lợi
Tiên phong công nghệ, uy tín
MISA là doanh nghiệp CNTT xuất sắc nhất khu vực Châu Á- Châu Đại Dương. Tiên phong xuất khẩu giải pháp SaaS
TOP đầu doanh nghiệp CNTT tăng trưởng liên tục với quy mô nhân sự tăng 20%/năm, doanh thu tăng 15%/năm
Hơn 100 giải thưởng trong ngành CNTT trong nước và quốc tế
Hội tụ 3000 nhân tài cùng khát vọng đưa sản phẩm công nghệ “Make In Vietnam” vươn tầm quốc tế
Xây dựng niềm tin với 270.000 khách hàng là đơn vị HCSN, doanh nghiệp, 2.5 triệu khách hàng cá nhân tại Việt Nam và 20 quốc gia
Nền tảng vững chắc cho phát triển sự nghiệp, thăng tiến, quyền lợi
Gói chăm sóc sức khỏe toàn diện tại Medlatec, cháy hết mình tại các CLB theo sở thích, chương trình teambuilding, du lịch định kỳ
Đánh giá review lương 2 lần/năm, nhiều cơ hội tăng lương 50- 70%/năm, thưởng sáng kiến...
Huấn luyện “Hổ tướng”: chương trình đào tạo quản lý tài năng, bệ phóng trở thành Chiến tướng tinh nhuệ
Giải thưởng “Gấu vàng": nơi tôn vinh những tài năng xuất sắc nhất
Lương cứng cạnh tranh. Thưởng năng suất dựa trên kết quả công việc từ 2 tháng lương.
Môi trường thân thiện, chia sẻ, đồng hành
Kết nối tài năng: tập trung phát triển những con người có chung lý tưởng, mục tiêu, cùng trao giá trị và nhận thành công
Nơi làm việc hạnh phúc: MISA mong muốn tạo một môi trường làm việc để bạn luôn cảm thấy hạnh phúc
Công nghệ cao: trang bị máy tính làm việc, tối ưu hiệu suất công việc bằng ứng dụng công nghệ, phần mềm tự động (AMIS, Jira, Power BI, AI Marketing,...)
Tư duy đột phá: môi trường tôn trọng sự khác biệt và đề cao sáng tạo, MISA- er được tự do phát triển các ý tưởng tiến bộ, cải tiến công việc
Cập nhật gần nhất lúc: 2025-11-08 19:30:04











