DATA SCIENTIST (TỐI ƯU HÓA NHÀ MÁY)
Mô tả công việc
Nền tảng dữ liệu (40% vai trò)
- Thu thập dữ liệu & pipeline
Thiết kế và triển khai data pipeline để thu thập dữ liệu từ ERP, hệ thống xưởng sản xuất và các nguồn khác tùy theo mục tiêu dự án (ví dụ: tiến hành nghiên cứu thời gian- thao tác để thu thập thời gian xử lý chính xác cho từng công đoạn)
Làm việc với đội ngũ xưởng sản xuất & đội ERP để thiết lập quy trình thu thập dữ liệu chuẩn
Đảm bảo chất lượng dữ liệu thông qua các quy tắc kiểm định và phát hiện bất thường
Thiết lập quy trình trích xuất, chuyển đổi và nạp dữ liệu (ETL) tự động
- Phân tích dữ liệu & insight
Phân tích dữ liệu sản xuất lịch sử để xác định điểm nghẽn, xu hướng và cơ hội cải thiện
Thực hiện phân tích thống kê về hiệu suất sử dụng máy, thời gian chu kỳ và hiệu suất giao hàng
Tạo dashboard KPI cho quản lý sản xuất (OEE, giao hàng đúng hạn, năng suất)
- Chất lượng & quản trị dữ liệu
Viết tài liệu cho từ điển dữ liệu, lược đồ và nguồn gốc dữ liệu
Đảm bảo biên độ biến thiên của các mẫu dữ liệu
Định nghĩa các chỉ số chất lượng dữ liệu và giám sát liên tục tình trạng dữ liệu
Xác định và giải quyết sự không nhất quán dữ liệu giữa các hệ thống (ERP so với xưởng sản xuất thực tế)
- Chuẩn bị dữ liệu cho đào tạo thuật toán, AI/ML
Xây dựng pipelines đặc điểm kỹ thuật cho model ANN dự báo thời gian sản xuất
Làm sạch, gán nhãn và cấu trúc hóa tập dữ liệu cho việc huấn luyện thuật toán và model ML
Tạo & phân chia tập dữ liệu training/validation/test với ngữ cảnh sản xuất phù hợp
Thu thập và gán nhãn hình ảnh thiết kế sản phẩm cho model CNN phân loại
Phát triển thuật toán & mô hình (40% vai trò)
- Giai đoạn 2: Tối ưu hóa & dự đoán
Tích hợp thuật toán với các hệ thống ERP/MES hiện có thông qua API
Thiết kế và triển khai các thuật toán tối ưu hóa kế hoạch sản xuất (GA, NSGA- II hoặc metaheuristic tương tự)
Phát triển mô hình CNN+ANN để dự đoán thời gian sản xuất từ hình ảnh thiết kế sản phẩm
Kiểm định kết quả mô hình so với dữ liệu sản xuất thực tế
Hợp tác với tư vấn viên Kỹ sư Công nghiệp để xác định các ràng buộc và xác minh độ tin cậy của thuật toán
- Giai đoạn 3: Reinforcement learning
Triển khai agent RL & tích hợp với MES để ra quyết định trực tiếp
Xây dựng môi trường mô phỏng (digital twin) để huấn luyện agent
Định nghĩa và tinh chỉnh hàm reward phù hợp với KPI sản xuất
Thiết kế và phát triển các agent Deep Reinforcement Learning (DRL) cho lập kế hoạch sản xuất theo thời gian thực
Phối hợp & cộng tác (20% vai trò)
- Hợp tác với đội IT để tích hợp hệ thống và triển khai
- Viết tài liệu cho model, thuật toán, data pipelines và kiến trúc hệ thống
- Làm việc chặt chẽ với giám sát xưởng sản xuất để hiểu các ràng buộc sản xuất thực tế
- Chuyển đổi các phát hiện từ phân tích chuyên sâu thành khuyến nghị hành động cho ban lãnh đạo
- Trình bày cập nhật tiến độ và báo cáo hiệu suất mô hình định kỳ
Chịu trách nhiệm thưc hiện các công việc tương tự khác tùy theo mục tiêu cụ thể của dự án ở từng giai đoạn.
Yêu cầu công việc
Học Vấn (không bắt buộc)
- Tốt nghiệp Đại học/Cao học chuyên ngành: Khoa học Máy tính, Khoa học Dữ liệu, Thống kê, Toán Ứng dụng, Kỹ thuật Công nghiệp hoặc ngành liên quan
Kỹ năng dữ liệu (quan trọng)
- Python cho Dữ liệu: Pandas, NumPy, xử lý và thao tác dữ liệu
- SQL: Thành thạo — truy vấn phức tạp, join, aggregation, window function
- ETL/pipeline: Có kinh nghiệm xây dựng data pipelines (Apache Airflow, script tùy chỉnh hoặc tương tự)
- Phân tích Thống kê: Kiểm định giả thuyết, hồi quy, phân tích chuỗi thời gian
- Trực quan hóa Dữ liệu: Matplotlib, Plotly, Power BI hoặc tương tự
Kỹ năng ML
- Có kinh nghiệm với ít nhất một dự án ML end- to- end (từ thu thập dữ liệu đến triển khai)
- Hiểu biết về huấn luyện mô hình, xác thực và các chỉ số đánh giá
- Có kinh nghiệm với CNN, ANN và framework deep learning (PyTorch hoặc TensorFlow)
Kinh nghiệm
- Minh chứng đã từng làm việc với dữ liệu lộn xộn từ thực tế (không chỉ tập dữ liệu sạch từ Kaggle)
- 2+ năm kinh nghiệm trong khoa học dữ liệu, phân tích dữ liệu hoặc các vai trò liên quan
Kỹ năng mềm
- Thoải mái làm việc tại chỗ ở các cơ sở sản xuất khi cần
- Kỹ năng giao tiếp tốt (ưu tiên thành thạo tiếng Anh)
- Tư duy phân tích và giải quyết vấn đề
- Khả năng làm việc với các bên liên quan không chuyên kỹ thuật (quản lý nhà máy, vận hành viên)
Ưu tiên nhưng không bắt buộc
- Tiếp xúc với các khái niệm Reinforcement Learning (Q- learning, policy gradient methods, PPO)
- Quen thuộc với các khái niệm Nghiên cứu Vận hành (job shop scheduling, constraint satisfaction)
- Có kinh nghiệm với các thuật toán tối ưu hóa (Genetic Algorithm, NSGA- II, Simulated Annealing)
- Có kinh nghiệm với các dự án phân loại hình ảnh
- Quen thuộc với các thư viện tối ưu hóa: pymoo, DEAP, scipy.optimize, OR- Tools
- Có kinh nghiệm trong sản xuất, chuỗi cung ứng hoặc lĩnh vực công nghiệp
- Hiểu biết về hệ thống ERP/MES (SAP, Oracle hoặc tương tự)
Công cụ & công nghệ
- Cơ sở dữ liệu: PostgreSQL, MySQL, MongoDB
- Trực quan hóa: Plotly, Matplotlib, Power BI
- Công cụ tối ưu: pymoo, DEAP, scipy.optimize
- Ngôn ngữ: Python, SQL
- Dữ liệu: Pandas, NumPy, Apache Airflow, dbt
- Hạ tầng: Docker, Git, Linux
- ML/DL: PyTorch, TensorFlow, scikit- learn
Ngoại ngữ: Tiếng Anh (bắt buộc)
Quyền lợi
Laptop, Chế độ bảo hiểm, Du Lịch, Phụ cấp, Chế độ thưởng, Chăm sóc sức khỏe, Đào tạo, Tăng lương, Công tác phí, Nghỉ phép năm
Cập nhật gần nhất lúc: 2026-01-24 12:30:03

TRAN DUC CORPORATION - CÔNG TY CỔ PHẦN TRẦN ĐỨC
Bí kíp tìm việc an toàn
Tiện ích hỗ trợ bạn
Việc làm đề xuất liên quan
Hiện tại chúng tôi chưa có việc làm đề xuất phù hợp với bạn.








