Bài học cùng chủ đề
Báo cáo học liệu
Mua học liệu
Mua học liệu:
-
Số dư ví của bạn: 0 coin - 0 Xu
-
Nếu mua học liệu này bạn sẽ bị trừ: 2 coin\Xu
Để nhận Coin\Xu, bạn có thể:
![](https://rs.olm.vn/images/bird.gif)
Bài 28. Thực hành trải nghiệm trích rút thông tin và tri thức SVIP
1. Đề bài
Nguồn dữ liệu: Cộng đồng Khoa học dữ liệu và Học máy Kaggle.
![Bảng xếp hạng khả năng tín dụng Bảng xếp hạng khả năng tín dụng](https://cdn3.olm.vn/upload/img_teacher/1016/img_teacher_2024-10-16_670f7dc479417.jpg)
Yêu cầu: Phân tích mối quan hệ giữa các nhóm khách hàng với xếp hạng khả năng tín dụng.
Công cụ sử dụng: Excel Data Analysis.
2. Thực hành xử lí dữ liệu
a) Chuẩn bị dữ liệu với Power Query
Bước 1. Tải dữ liệu từ trang cung cấp và đặt tên là VD_KHDL.
Bước 2. Mở tệp VD_KHDL trong Excel.
Bước 3. Chọn vùng dữ liệu muốn xử lí: Chọn Data → Get Data → From Data/Range hoặc Data → From Table.
b) Tiền xử lí dữ liệu
Bước 1. Tạo cột Mức thu nhập từ cột Thu thập năm:
- Chọn cột Thu thập năm.
- Chọn Add Column → Conditional Column:
![Tạo cột dữ liệu Tạo cột dữ liệu](https://cdn3.olm.vn/upload/img_teacher/1016/img_teacher_2024-10-16_670f7ff9a6b62.jpg)
- Phân mức thu nhập thành các nhóm: Thấp ≤ 25000; Trung bình (25000 - 50000]; Khá (50000 - 75000]; Cao ≥ 75000.
![Tạo phân loại mức dữ liệu Tạo phân loại mức dữ liệu](https://cdn3.olm.vn/upload/img_teacher/1016/img_teacher_2024-10-16_670f8073129fd.jpg)
Bước 2. Thực hiện các thao tác tương tự đối với cột Số tuổi, cột Nhóm tuổi: < 21; 21 - 30; 31 - 40; 41 - 50; > 50.
![Kết quả bổ sung cột mới từ dữ liệu các cột đã có Kết quả bổ sung cột mới từ dữ liệu các cột đã có](https://cdn3.olm.vn/upload/img_teacher/1016/img_teacher_2024-10-16_670f81d48dda5.jpg)
Bước 3. Lưu lại kết quả sau tiền xử lí.
Bước 4. Đổi tên bảng dữ liệu đã qua xử lí.
![Đổi tên bảng sau xử lí Đổi tên bảng sau xử lí](https://cdn3.olm.vn/upload/img_teacher/1016/img_teacher_2024-10-16_670f8304e8c39.jpg)
c) Tạo trình tự sắp xếp dữ liệu mong muốn
Bước 1. File → Options → Advanced.
Bước 2. Di chuột xuống mục General → Edit Custom Lists.
Bước 3. Tạo danh sách mới: NEW LIST → Add.
![Tạo danh sách trình tự sắp xếp Tạo danh sách trình tự sắp xếp](https://cdn3.olm.vn/upload/img_teacher/1016/img_teacher_2024-10-16_670f841fefcdf.jpg)
Làm tương tự với cột Nhóm tuổi và cột Mức thu nhập để bổ sung các danh sách sắp xếp thứ tự tương ứng: < 21, 21 – 30, 31 – 40, 41 – 50, > 50 và Cao, Khá, Trung bình, Thấp.
3. Thực hành tổng hợp dữ liệu bằng PivotTable
a) Khởi tạo bảng PivotTable
Bước 1. Nhấn chuột vào ô bất kì trong bảng Processed_Data đã qua tiền xử liệu.
Bước 2. Trên thanh công cụ, chọn Insert → PivotTable:
- Chọn New Worksheet.
- Nhấn OK.
b) Tạo bảng tổng hợp Khả năng tín dụng theo Mức thu nhập
Bước 1. Kéo thả các cột được dùng vào các vùng Columns, Rows và Values tương ứng.
Bước 2. Kéo thả các cột dữ liệu vào các vùng, quan sát sự thay đổi của kết quả.
![Kết quả thống kê Kết quả thống kê](https://cdn3.olm.vn/upload/img_teacher/1016/img_teacher_2024-10-16_670f874367099.jpg)
c) Điều chỉnh hiển thị kết quả
Bước 1. Nháy nút phải chuột vào bảng vừa tạo.
Bước 2. Chọn Show Values As → % of Row Total để thu được kết quả sau.
![Kết quả tổng hợp theo % Kết quả tổng hợp theo %](https://cdn3.olm.vn/upload/img_teacher/1016/img_teacher_2024-10-16_670f87f53ef8c.jpg)
4. Tạo biểu đồ trực quan dữ liệu
Bước 1. Nháy chuột vào vị trí bất kì của bảng.
Bước 2. Chọn Insert → PivotChart → Column → OK.
![Biểu đồ trực quan từ bảng Biểu đồ trực quan từ bảng](https://cdn3.olm.vn/upload/img_teacher/1016/img_teacher_2024-10-16_670f8aafaf8f5.jpg)
Dựa vào kết quả thực hành, hãy trả lời các câu hỏi sau:
Bạn có thể đăng câu hỏi về bài học này ở đây