

Vũ Phương Thùy
Giới thiệu về bản thân



































Khoa học dữ liệu quan trọng?
1. Khai thác thông tin giá trị từ dữ liệu lớn (Big Data): Giúp phát hiện xu hướng, mô hình ẩn giấu trong dữ liệu mà con người không thể tự nhận ra.
2. Hỗ trợ ra quyết định thông minh: Quyết định dựa trên dữ liệu sẽ chính xác hơn cảm tính.
3. Tự động hóa và tối ưu hóa quy trình: Kết hợp với AI giúp tăng năng suất, giảm chi phí và cải thiện hiệu quả công việc.
4. Dự đoán tương lai: Phân tích dữ liệu lịch sử để dự đoán xu hướng, nhu cầu, rủi ro.
Ví dụ minh họa trong các lĩnh vực:
• Y tế: Dự đoán bệnh tật sớm dựa trên lịch sử bệnh án và thói quen sống (ví dụ: hệ thống AI dự báo nguy cơ tiểu đường).
• Tài chính: Phát hiện gian lận thẻ tín dụng, phân tích hành vi chi tiêu để tư vấn đầu tư.
• Kinh doanh: Amazon sử dụng khoa học dữ liệu để đề xuất sản phẩm phù hợp với từng người dùng, tăng doanh số bán hàng.
• Giáo dục: Phân tích dữ liệu học tập để phát hiện học sinh gặp khó khăn và đưa ra chương trình hỗ trợ phù hợp.
• Giao thông: Google Maps dùng dữ liệu di chuyển thực tế để dự đoán kẹt xe và đề xuất lộ trình tối ưu.
Khoa học dữ liệu là “chìa khóa” giúp biến dữ liệu thành tri thức, hỗ trợ phát triển, đổi mới và ra quyết định chính xác trong hầu hết các lĩnh vực của đời sống hiện đại.
1. Thu thập dữ liệu (Data Collection):
* Mô tả: Xác định và thu thập các bộ dữ liệu liên quan đến từng khách hàng. Các dữ liệu này bao gồm:
* Thông tin nhân khẩu học: Giới tính, tuổi tác.
* Sở thích.
* Thông tin tài chính: Thu nhập, thói quen chi tiêu.
* Hành vi mua sắm.
* Liên hệ hình ảnh: Các biểu tượng \mars \venus, , \text{túi mua sắm} đại diện cho các loại dữ liệu này.
* Hành động: Loại bỏ các cột dữ liệu không liên quan để tập trung vào những thông tin quan trọng cho việc phân loại.
2. Chuẩn bị dữ liệu (Data Preparation):
* Mô tả: Xử lý dữ liệu thô để làm cho nó phù hợp với mô hình Học máy. Các công việc bao gồm:
* Chuyển đổi dữ liệu thành định dạng bảng.
* Xử lý dữ liệu bị thiếu hoặc không đúng định dạng.
* Chia dữ liệu thành hai tập:
* Tập huấn luyện (Training set): Sử dụng để "dạy" mô hình nhận diện các mẫu và cấu trúc trong dữ liệu.
* Tập kiểm tra (Testing set): Sử dụng để đánh giá hiệu suất của mô hình sau khi huấn luyện.
* Liên hệ hình ảnh: Bước này diễn ra ngầm trước khi dữ liệu được đưa vào mô hình "x".
3. Huấn luyện mô hình (Model Training):
* Mô tả: Lựa chọn và huấn luyện một mô hình Học máy không giám sát phù hợp với mục tiêu phân cụm khách hàng.
* Liên hệ hình ảnh: Hình chữ nhật màu tím chứa chữ "x" tượng trưng cho mô hình Học máy. Hướng dẫn chỉ rõ đây là mô hình học không giám sát, có nghĩa là mô hình tự động tìm ra các nhóm khách hàng dựa trên sự tương đồng trong dữ liệu mà không cần nhãn trước.
4. Kiểm thử mô hình (Model Evaluation):
* Mô tả: Đánh giá hiệu suất của mô hình đã được huấn luyện bằng cách sử dụng tập dữ liệu kiểm tra.
* Liên hệ hình ảnh: Bước này diễn ra sau khi mô hình "x" đã được huấn luyện.
* Hành động: Nếu hiệu suất chưa đạt yêu cầu, tiến hành điều chỉnh mô hình (ví dụ: thay đổi thuật toán, điều chỉnh các tham số của mô hình).
5. Triển khai mô hình (Model Deployment):
* Mô tả: Đưa mô hình đã được huấn luyện và kiểm thử thành công vào ứng dụng thực tế để phân loại khách hàng mới hoặc khách hàng hiện tại.
* Liên hệ hình ảnh: Kết quả "Ông A thuộc nhóm 1" minh họa việc mô hình đã được triển khai và đang được sử dụng để phân loại khách hàng.
* Hành động: Giám sát hiệu quả của mô hình theo thời gian và thực hiện các cập nhật hoặc tái huấn luyện khi cần thiết để đảm bảo độ chính xác.
Chuyên viên kỹ thuật (hay kỹ thuật viên công nghệ thông tin) trong các công ty có ứng dụng CNTT đóng vai trò cốt lõi trong việc duy trì, phát triển và đảm bảo hoạt động ổn định của hệ thống công nghệ. Cụ thể:
1. Quản lý và bảo trì hệ thống CNTT:
• Cài đặt, cập nhật, sửa chữa phần mềm, phần cứng.
• Quản trị máy chủ, hệ thống mạng nội bộ, Internet, dữ liệu và bảo mật.
• Đảm bảo các thiết bị công nghệ (máy tính, máy in, mạng…) hoạt động trơn tru.
2. Hỗ trợ người dùng (IT support):
• Giải quyết các sự cố kỹ thuật mà nhân viên gặp phải.
• Hướng dẫn sử dụng phần mềm, thiết bị một cách hiệu quả và an toàn.
3. Đảm bảo an toàn thông tin:
• Cài đặt và duy trì các biện pháp bảo mật (firewall, phần mềm chống virus…).
• Giám sát nguy cơ tấn công mạng, sao lưu và phục hồi dữ liệu khi cần.
4. Tham gia phát triển hệ thống phần mềm và công nghệ mới:
• Hỗ trợ lập trình, thiết kế phần mềm phù hợp với nhu cầu công ty.
• Tư vấn lựa chọn công nghệ, nền tảng phù hợp để nâng cao hiệu suất làm việc.
5. Góp phần nâng cao năng suất làm việc:
• Tối ưu hóa hệ thống CNTT để rút ngắn thời gian xử lý công việc.
• Ứng dụng tự động hóa, điện toán đám mây, và công nghệ mới vào quy trình sản xuất/kinh doanh.
Chuyên viên kỹ thuật là người “giữ nhịp” cho hoạt động công nghệ trong công ty, giúp mọi bộ phận sử dụng công nghệ hiệu quả, an toàn và liên tục cập nhật đổi mới.
Khoa học dữ liệu quan trọng trong nhiều lĩnh vực vì nó giúp phân tích, khai thác và hiểu dữ liệu, từ đó hỗ trợ ra quyết định chính xác, hiệu quả hơn trong các hoạt động của cá nhân, tổ chức, doanh nghiệp hay cả chính phủ.