Data Analysis with Databricks
Tổng quan khóa học
Khóa học DATB-DA: Data Analysis with Databricks cung cấp kiến thức toàn diện về Databricks SQL, giúp học viên thực hiện các tác vụ phân tích dữ liệu như nhập dữ liệu, truy vấn SQL, trực quan hóa dữ liệu, xây dựng dashboard và thiết lập cảnh báo.
Khóa học cũng giúp học viên chuẩn bị cho kỳ thi Databricks Certified Data Analyst Associate. Chương trình bao gồm hai mô-đun chính với tổng thời lượng 1 ngày, được giảng dạy theo hình thức trực tiếp (ILT) hoặc trực tuyến có giảng viên hướng dẫn (VILT).
Mục tiêu khóa học
Sau khi hoàn thành khóa học, học viên có thể:
-
Sử dụng Databricks SQL để phân tích và xử lý dữ liệu hiệu quả
-
Thực hiện nhập dữ liệu và truy vấn dữ liệu từ nhiều nguồn
-
Xây dựng view, dashboard và trực quan hóa dữ liệu phục vụ phân tích kinh doanh
-
Hiểu và áp dụng Unity Catalog trong quản lý dữ liệu
-
Sử dụng AI/BI Dashboards và AI/BI Genie để hỗ trợ phân tích tự phục vụ
-
Tối ưu hóa truy vấn SQL và phân tích hiệu suất hệ thống
-
Chuẩn bị kiến thức nền tảng cho chứng chỉ Databricks Certified Data Analyst Associate
Đối tượng học viên
Khóa học phù hợp với:
-
Chuyên viên phân tích dữ liệu (Data Analyst), BI Developer và chuyên viên báo cáo (Reporting Specialist)
-
Người làm việc với dữ liệu trong môi trường Lakehouse sử dụng Databricks SQL
-
Người có kiến thức SQL muốn nâng cao kỹ năng với Databricks SQL Editor, dashboard và Unity Catalog
-
Người chuyển đổi từ các công cụ BI truyền thống sang nền tảng phân tích dữ liệu hợp nhất
-
Thành viên nhóm dữ liệu hỗ trợ ra quyết định dựa trên dữ liệu (data-driven decision making)
Yêu cầu kiến thức
Học viên nên có:
-
Kiến thức cơ bản về SQL và phân tích dữ liệu
-
Hiểu cách dữ liệu được tạo, lưu trữ và quản lý
-
Kiến thức cơ bản về thống kê và phân tích kết quả
-
Hiểu các định dạng dữ liệu như CSV, JSON, TXT, Parquet
-
Làm quen với giao diện Databricks Data Intelligence Platform
-
Kinh nghiệm cơ bản với Databricks Workspace
-
Hiểu khái niệm dashboard trong BI (Business Intelligence)
Nội dung đào tạo
Module 1: SQL Analytics trên Databricks
1.1. Khám phá dữ liệu
-
Sử dụng Unity Catalog để khám phá dữ liệu
-
Hiểu quyền sở hữu đối tượng dữ liệu
-
Tìm kiếm và kiểm tra tập dữ liệu bằng Unity Catalog
1.2. Nhập dữ liệu
-
Nhập dữ liệu vào Databricks
-
Upload dữ liệu qua giao diện người dùng
-
Khai thác và nạp dữ liệu lập trình vào Unity Catalog
1.3. Thực thi SQL
-
Databricks SQL và SQL Warehouse
-
Sử dụng SQL Editor
-
Biến đổi và phân tích dữ liệu bằng SQL
-
Tạo view và làm việc với bảng dữ liệu
1.4. Phân tích truy vấn
-
Databricks Photon và tối ưu hiệu suất
-
Query Insights
-
Thực hành tốt nhất khi phân tích SQL
Module 2: AI/BI cho Data Analyst
2.1. Dashboard và trực quan hóa
-
AI/BI Dashboards
-
Viết SQL cơ bản phục vụ dashboard
-
Thiết kế dataset cho dashboard
-
Tạo biểu đồ và thống kê tổng hợp
-
Tính năng hỗ trợ AI trong BI
-
Bộ lọc dữ liệu (Filters)
-
Chia sẻ dashboard với người dùng liên quan
-
Quản lý dashboard trong môi trường production
-
Bài thực hành xây dựng dashboard
2.2. AI/BI Genie
-
Giới thiệu AI/BI Genie
-
Xây dựng Genie Spaces
-
Chia sẻ Genie Spaces
-
Thực hành phát triển AI/BI Genie
Lịch khai giảng
Form đăng ký
Các khóa đào tạo Databricks khác
Đăng ký tư vấn
cùng đội ngũ chuyên gia Trainocate!!
Bản quyền thuộc về Trainocate Việt Nam
