CÔNG TY TNHH TRAINOCATE VIỆT NAM
Introduction to Python for Data Science and Data Engineering

Introduction to Python for Data Science and Data Engineering

Introduction to Python for Data Science and Data Engineering

Tổng quan khóa học

Khóa học DATB-IPDSDE: Introduction to Python for Data Science and Data Engineering là chương trình nhập môn dành cho người mới bắt đầu với Python, tập trung vào việc ứng dụng Python trong xử lý dữ liệu cho Data Science và Data Engineering trên nền tảng Databricks.

 

Khóa học cung cấp nền tảng từ cơ bản về lập trình Python, cấu trúc dữ liệu, hàm, lớp, đến kỹ năng phân tích dữ liệu với pandas và trực quan hóa dữ liệu. Học viên cũng được làm quen với môi trường Databricks và các khái niệm cơ bản về cloud computing.

Mục tiêu khóa học

Sau khi hoàn thành khóa học, học viên có thể:

  • Sử dụng Databricks Workspace để lập trình Python cơ bản

  • Hiểu cú pháp Python, biến, kiểu dữ liệu và luồng điều khiển

  • Làm việc với cấu trúc dữ liệu và thao tác dữ liệu bằng Python

  • Viết hàm, sử dụng lớp (class) trong Python

  • Sử dụng thư viện pandas để phân tích dữ liệu

  • Tạo biểu đồ đơn giản phục vụ phân tích dữ liệu

  • Áp dụng Python vào các bài toán Data Science và Data Engineering cơ bản

  • Hiểu các khái niệm cơ bản về cloud computing

Đối tượng học viên

Khóa học phù hợp với:

  • Người mới bắt đầu học Python

  • Data Analyst, Data Scientist hoặc Data Engineer chưa có nền tảng lập trình

  • Người muốn chuyển sang lĩnh vực Data Science và Data Engineering

  • Người làm việc với dữ liệu nhưng chưa sử dụng Python

  • Nhân sự cần chuẩn bị nền tảng cho các khóa học Databricks nâng cao (ML, DE, GenAI)

Yêu cầu kiến thức

Không yêu cầu kinh nghiệm lập trình trước đó. Tuy nhiên, học viên sẽ học tốt hơn nếu có:

  • Hiểu cơ bản về dữ liệu (bảng, hàng, cột)

  • Biết sử dụng máy tính và trình duyệt web

  • Có tư duy phân tích dữ liệu cơ bản

  • (Không bắt buộc) đã từng tiếp xúc với lập trình hoặc Excel/BI tools

Nội dung đào tạo

Module 1: Ngày 1 – Nền tảng Python

  • Giới thiệu môi trường Databricks

  • Tổng quan về Python

  • Biến và kiểu dữ liệu

  • Cấu trúc dữ liệu phức hợp (list, tuple, dict, set)

  • Câu lệnh điều kiện (if/else)

  • Vòng lặp (for, while)

  • Hàm trong Python

  • Lập trình hướng đối tượng (Class & Object)

 

Module 2: Ngày 2 – Phân tích dữ liệu với Python

  • Sử dụng thư viện trong Python

  • Phân tích dữ liệu với pandas

  • Các phương thức nâng cao trong pandas

  • Trực quan hóa dữ liệu (data visualization)

  • Giới thiệu Cloud Computing

  • Bài thực hành tổng hợp (capstone project)

  • Định hướng học tiếp theo

Lịch khai giảng

Form đăng ký

Bằng cách nhấn nút "ĐĂNG KÝ", tôi hoàn toàn đồng ý với Chính sách quyền riêng tư

Các khóa đào tạo Databricks khác

Đăng ký tư vấn
cùng đội ngũ chuyên gia Trainocate!!

Bản quyền thuộc về Trainocate Việt Nam

back to top
icon đăng ký