CÔNG TY TNHH TRAINOCATE VIỆT NAM
Machine Learning with Databricks

Machine Learning with Databricks

Machine Learning with Databricks

Tổng quan khóa học

Khóa học DATB-ML: Machine Learning with Databricks là chương trình đào tạo toàn diện giúp học viên làm chủ toàn bộ quy trình Machine Learning trên nền tảng Databricks.

 

Khóa học bao gồm các giai đoạn từ chuẩn bị dữ liệu, xây dựng và huấn luyện mô hình, tối ưu tham số, đến triển khai và vận hành mô hình trong môi trường production. Học viên sẽ được hướng dẫn thực hành trực tiếp với các công cụ như MLflow, AutoML, Feature Store và Model Serving.

Mục tiêu khóa học

Sau khi hoàn thành khóa học, học viên có thể:

  • Chuẩn bị và xử lý dữ liệu phục vụ Machine Learning

  • Thực hiện feature engineering và quản lý feature store

  • Xây dựng và đánh giá mô hình ML với MLflow

  • Tối ưu mô hình bằng hyperparameter tuning và Hyperopt

  • Sử dụng AutoML để tăng tốc phát triển mô hình

  • Triển khai mô hình theo nhiều hình thức: batch, pipeline và real-time

  • Sử dụng Databricks Model Serving cho triển khai production

  • Thiết kế và vận hành hệ thống MLOps hiện đại

  • Giám sát và đánh giá hiệu suất mô hình trong môi trường thực tế

Đối tượng học viên

Khóa học phù hợp với:

  • Data Scientist và Machine Learning Engineer

  • AI/ML Practitioner xây dựng hệ thống ML end-to-end trên Databricks

  • Người làm việc với feature engineering, model training và deployment

  • Kỹ sư dữ liệu và AI có kiến thức Python và muốn nâng cao kỹ năng ML thực chiến

  • Đội ngũ phát triển ML pipeline hướng đến production-ready MLOps

  • Chuyên gia chuyển đổi từ mô hình thử nghiệm sang hệ thống AI vận hành thực tế

Yêu cầu kiến thức

Học viên nên có:

  • Kiến thức cơ bản về Machine Learning (regression, classification)

  • Hiểu vòng đời mô hình ML và MLflow tracking

  • Kinh nghiệm sử dụng Databricks Workspace và Notebook

  • Hiểu cơ bản về Delta Lake và Lakehouse architecture

  • Kỹ năng Python ở mức trung cấp

  • Kiến thức cơ bản về feature engineering và data preprocessing

Module 1: Data Preparation for Machine Learning

  • Quản lý và khám phá dữ liệu trong Lakehouse

  • Làm sạch và chuẩn hóa dữ liệu cho ML

  • Feature engineering cơ bản

  • Xử lý dữ liệu thiếu (data imputation)

  • Encoding dữ liệu categorical

  • Standardization và scaling dữ liệu

  • Giới thiệu Feature Store trong Databricks

 

Module 2: Machine Learning Model Development

  • Quy trình phát triển mô hình ML

  • Theo dõi thí nghiệm với MLflow

  • Đánh giá hiệu suất mô hình

  • Hyperparameter tuning cơ bản

  • Tuning mô hình với Hyperopt

  • Sử dụng AutoML để tự động hóa xây dựng mô hình

 

Module 3: Machine Learning Model Deployment

  • Chiến lược triển khai mô hình ML

  • Triển khai mô hình với MLflow

  • Batch inference

  • Pipeline deployment

  • Real-time inference với Model Serving

  • Giới thiệu Databricks Model Serving

  • Quản lý mô hình trong môi trường production

 

Module 4: Machine Learning Operations (MLOps)

  • Tổng quan MLOps hiện đại

  • MLOps trên nền tảng Databricks

  • Nguyên tắc thiết kế MLOps kiến trúc

  • Kiến trúc MLOps khuyến nghị

  • Giám sát mô hình Machine Learning

  • Các loại monitoring trong ML

  • MLOps stack và best practices vận hành hệ thống

Lịch khai giảng

Form đăng ký

Bằng cách nhấn nút "ĐĂNG KÝ", tôi hoàn toàn đồng ý với Chính sách quyền riêng tư

Các khóa đào tạo Databricks khác

Đăng ký tư vấn
cùng đội ngũ chuyên gia Trainocate!!

Bản quyền thuộc về Trainocate Việt Nam

back to top
icon đăng ký