Anyone in the world
Trong khóa học này, học viên sẽ được học các khái niệm và kỹ thuật cơ
bản về thu thập dữ liệu và một số phân tích ban đầu trên dữ liệu. Nội
dung khóa học bao gồm các kỹ thuật cơ bản và các công cụ dùng cho việc
tìm hiểu, tiền xử lý, và làm sạch dữ liệu thông qua các thao tác về
nhóm, làm trơn, lấy đại diện dữ liệu. Khóa học giúp cho học viên nắm bắt
được các kỹ thuật để giải quyết những vấn đề thường gặp phải khi làm
việc với dữ liệu trong thực tế như mất mát dữ liệu (missing data), giảm
chiều dữ liệu (dimensionality reduction), hay lựa chọn, xác định các đặc
trưng dữ liệu (feature engineering). Học viên sẽ được học các kỹ thuật
cơ bản của phân tích dữ liệu trực quan (exploratory data analysis – EDA)
giúp họ có thể tóm tắt, trực quan hóa ban đầu để hiểu về dữ liệu, cũng
như phát hiện các ngoại lai (outliers) trong các tập dữ liệu lớn. Sử
dụng các công cụ của EDA, học viên sẽ học được cách thức phát hiện ra
mối quan hệ giữa các thuộc tính của dữ liệu để từ đó lựa chọn các mô
hình hợp lý cho dữ liệu cần xử lý.
[ Modified: Tuesday, 11 June 2019, 1:54 PM ]