

Lê Thị Minh Thư
Giới thiệu về bản thân



































- Khoa học dữ liệu quan trọng vì nó giúp phân tích, hiểu và khai thác giá trị từ dữ liệu lớn để hỗ trợ ra quyết định chính xác hơn, tối ưu hóa hoạt động và dự đoán xu hướng tương lai trong hầu hết các lĩnh vực.
- Ví dụ: ngành y tế
+ Ứng dụng: dự đoán bệnh sớm dựa trên dữ liệu bệnh án, xét nghiệm, di truyền.
+ VD: sử dụng mô hình học máy để phát hiện sớm ung thư vú qua ảnh chụp X-quang.
- Cài đặt và bảo trì hệ thống.
- Hỗ trợ kĩ thuật.
- Quản trị mạng và dữ liệu.
- Phát triển và nâng cấp hệ thống.
- Đào tạo và tư vấn.
Bước 1: Thu thập dữ liệu khách hàng
- Lịch sử giao dịch/ mua hàng.
- Hồ sơ khách hàng (giới tính, thu nhập, tuổi...)
- Dữ liệu hành vi (tần suất mua hàng, số tiền chi tiêu, thời gian mua hàng,...)
- Dữ liệu web/app (sở thích, lượt xem sản phẩm, thời gian truy cập...)
Bước 2: Tiền xử lí dữ liệu
- Làm sạch dữ liệu: Xử lí giá trị thiếu, dữ liệu sai lệch.
- Chuẩn hóa: ví dụ chuẩn hóa thu nhập hoặc chi tiêu về cùng 1 đơn vị.
- Mã hóa dữ liệu phân loại: giới tính, sở thích (mã hóa bằng one-hot encoding)
- Rút trích đặc trưng: tạo các chỉ số như RFM, tỉ lệ chi tiêu theo danh mục, tần suất mua sắm theo thời điểm
Bước 3: Chọn mô hình phân nhóm
- Dùng thuật toán không giám sát như: K-means clustering, Hierarchical clustering, DBSCAN
- Mục tiêu là nhóm khách hàng thành các cụm có đặc điểm giống nhau về tuổi, hành vi, thu nhập...
Bước 4: Phân tích và gán nhãn nhóm
Sau khi chia cụm, tiến hành phân tích từng nhóm để gán nhãn như sau:
1. Nhóm khách hàng mới
- Vừa tạo tài khoản hoặc mua hàng lần đầu.
- Thường có hành vi khám phá, ít tương tác.
2. Nhóm khách hàng tiềm năng
- Tần suất truy cập nhiều nhưng chưa mua nhiều.
- Chi tiêu thấp nhưng quan tâm nhiều sản phẩm.
- Có thu nhập tốt, hành vi mua sắm hợp xu hướng.
3. Nhóm khách hàng thân thiết
- Mua hàng đều đặn, chi tiêu cao.
- Thường quay lại mua, hay tương tác.
- Có đặc điểm trung thành, phù hợp chiến dịch giữ chân.
Bước 5: Triển khai và theo dõi
- Gửi nhóm kết quả đến bộ phận marketing hoặc bán hàng để cá nhân hóa chiến dịch.
- Liên tục cập nhật dữ liệu mới và huấn luyện lại mô hình định kì để duy trì hiệu quả.