K
Khách

Hãy nhập câu hỏi của bạn vào đây, nếu là tài khoản VIP, bạn sẽ được ưu tiên trả lời.

19 tháng 5

Một vài thành tựu chính của Khoa học dữ liệu:

a) Khám phá tri thức và nâng cao năng lực ra quyết định

Khoa học dữ liệu đã giúp tạo ra các phát hiện mới và tri thức từ dữ liệu, từ việc tìm ra các mẫu dữ liệu (data patterns) và mối liên hệ giữa chúng đến khám phá tri thức mới. Cùng với Học máy, Khoa học dữ liệu đã giúp tạo ra các mô hình mở ra khả năng khám phá tri thức từ nhiều nguồn dữ liệu, từ đó tăng hiệu quả quyết định dựa trên dữ liệu. Hơn nữa, khả năng dự đoán, dự báo xu hướng và sự kiện trong tương lai từ dữ liệu hiện tại đã nâng cao hiệu quả của quá trình ra quyết định. Ví dụ, các ứng dụng như SAS của SAS Institute, SPSS Modeler của IBM thường được các tổ chức tài chính và ngân hàng sử dụng để phân tích, khai phá dữ liệu về các giao dịch để xác định được xu hướng hay các bất thường nhằm đưa ra quyết định liên quan lãi suất hay phát hiện kịp thời các rủi ro,...

b) Tự động hoá

Khoa học dữ liệu cùng với các mô hình học máy đã giúp tự động hoá các tác vụ lặp đi lặp lại. Ví dụ, robot thông minh như Amazon Robotic Drive Units (RDU) được tích hợp các mô hình

học máy để phân tích dữ liệu camera, vận tốc, hướng di chuyển, cảm biến,... nhầm tự động hoà việc vận chuyển hàng hoá và sắp xếp các sản phẩm trong kho, giảm thời gian cần thiết để vận chuyển từ các khu vực lưu trữ đến khu vực đóng gói dùng trong các kho hàng của Amazon. Vi dụ khác vẽ tự động hoá dựa trên Khoa học dữ liệu là hệ thống kiểm soát môi trưởng sử dụng trong nông nghiệp nhằm phân tích dữ liệu về độ ẩm, nhiệt độ, ánh sáng, cảm biến.... để tối ưu hoá diễu kiện cho sự phát triển của cây trắng hay vật nuôi.

c) Cá nhân hoá dịch vụ

Khoa học dữ liệu đã đóng góp đáng kể vào việc phát triển và triển khai các phương pháp cá nhân hoá, từ việc hiểu biết rõ người dùng đến việc tạo ra trải nghiệm cá nhân hoá trong nhiều lĩnh vực khác nhau. Ví dụ, các ứng dụng truyền thông như Netflix, YouTube có thể để xuất nội dung phù hợp với sở thích và lịch sử xem của người dùng. Ví dụ khác là các trang thương mại điện tử như Amazon, Ebay,... sử dụng dữ liệu lịch sử mua sắm và đánh giá của người dùng để để xuất sản phẩm hay chương trình giảm giá phù hợp với từng khách hàng hay nhóm khách hàng. d) Dự đoán

Khoa học dữ liệu đóng vai trò quan trọng trong phát triển các mô hình học máy có dùng trong phân loại và dự đoán. Các mô hình học máy sử dụng dữ liệu y tế, hình ảnh y khoa để hỏ trợ chẩn đoán, phân tích xu hướng bệnh, dự đoán tình trạng sức khoẻ cá nhân. Một số thành lựu có thể kể đến như phần mềm IBV Watson for Oncology giúp góp phần nâng cao hiệu quả điều trị ung thư và đã được ứng dụng ở Việt Nam.

Đề thi đánh giá năng lực

19 tháng 5

a) Sơ lược về (khái niệm) Khoa học dữ liệu

Khoa học dữ liệu nghiên cứu ứng dụng các phương pháp và kĩ thuật từ nhiều lĩnh vực khác nhau như Toán học, thống kê, khoa học máy tính, trí tuệ nhân tạo, học máy…để tạo ra thông tin từ dữ liệu.

b) Mục tiêu cụ thể của Khoa học dữ liệu

Mục tiêu chính của Khoa học dự liệu là phân tích, khám phá thông tin, trực quan hoá dữ liệu, tối ưu hoá quyết định nhằm tạo ra tri thức và hỗ trợ giải quyết các vấn đề.

19 tháng 5

Nhà trường thường thu thập, lưu trữ và xử lý những dữ liệu về học sinh như: họ tên, ngày tháng nắm sinh, giới tính, địa chỉ, thông tin gia đình…

19 tháng 5

Ngoài các ứng dụng được nhắc đến ở trên, học máy còn được ứng dụng để thực hiện công việc Phân tích thị trường trong cuộc sống.

Học máy có vai trò quan trọng trong phân tích thị trường, giúp các tổ chức hiểu rõ hơn về thị trường để có thể đưa ra quyết định hợp lí. Dựa vào khả năng dự đoán mà học máy được sử dụng để dự đoán xu hướng, hành vi của người tiêu dùng, phản ứng của thị trường đối với việc điều chỉnh giá sản phẩm, phân tích hiệu suất chiến lược kinh doanh, phân loại khách hàng, tự động đánh giá phản hồi của khách hàng,... Công cụ phân tích thị trường được sử dụng phổ biến hiện nay là Power BI do Microsoft phát triển, sử dụng mô hình học máy để phân tích dữ liệu và đưa ra các báo cáo, kết quả theo yêu cầu của người dùng.

19 tháng 5

Nhận dạng giọng nói là một trong những ứng dụng phổ biến của học máy. Những tiến bộ gần đây trong học máy cho phép các hệ thống nhận dạng giọng nói một cách chính xác, thông qua việc phân tích một lượng lớn dữ liệu để có thể hiểu rõ bối cảnh của cuộc hội thoại. Ngoài ra, các mô hình học máy có thể nhận dạng được phương ngữ và giọng điệu khác nhau, cho phép hệ thống nhận dạng giọng nói hiểu nhiều ngôn ngữ và phương ngữ. Các ứng dụng như Youtube, Google Assistant, Apple Siri,... đều được tích hợp chức năng nhận dạng giọng nói nhằm tăng tính tiện dụng.

19 tháng 5

Trình bày sơ lược hai phương pháp học giám sát và học không giám sát:

- Học giám sát:

Học có giám sát là phương pháp học máy sử dụng dữ liệu có nhãn. Trong đó, các mẫu dữ liệu được gán nhãn hoặc đầu ra xác định. Mục tiêu của học có giám sát là xây dựng một mô hình có khả năng dự đoán hay phân loại đối tượng dữ liệu mới dựa trên tri thức đã được học từ các mẫu dữ liệu đã được gán nhãn. Học có giám sát thường được ứng dụng trong lọc thư rác, nhận dạng đối tượng trong hình ảnh hay video, nhận dạng tiếng nói, chẩn đoán bệnh trong y tế,...

về một

Hình 2 minh hoạ một ví dụ về mô hình học có giám sát với dữ liệu học (Hình 2a) là các hình ảnh được gán nhãn, sau đó khi đưa hình ảnh mới (Hình 2b) thì mô hình sẽ phân loại được là con thỏ.

Học không giám sát:

Học không giám sát là phương pháp học máy sử dụng dữ liệu không có nhãn. Các mô hình trong phương pháp này phân tích mối quan hệ (tương tự hay khác biệt), tần suất cùng xuất hiện,... của dữ liệu đầu vào nhằm khám phá các thông tin ẩn chứa trong dữ liệu. Các kĩ thuật học không giám sát bao gồm gom cụm, giảm chiều dữ liệu,... Trong đó, kĩ thuật gom cụm thường được ứng dụng để chia dữ liệu thành các nhóm dựa trên sự tương đồng của dữ liệu.

19 tháng 5

Trình bày sơ lược hai phương pháp học giám sát và học không giám sát:

- Học giám sát:

Học có giám sát là phương pháp học máy sử dụng dữ liệu có nhãn. Trong đó, các mẫu dữ liệu được gán nhãn hoặc đầu ra xác định. Mục tiêu của học có giám sát là xây dựng một mô hình có khả năng dự đoán hay phân loại đối tượng dữ liệu mới dựa trên tri thức đã được học từ các mẫu dữ liệu đã được gán nhãn. Học có giám sát thường được ứng dụng trong lọc thư rác, nhận dạng đối tượng trong hình ảnh hay video, nhận dạng tiếng nói, chẩn đoán bệnh trong y tế,...

về một

Hình 2 minh hoạ một ví dụ về mô hình học có giám sát với dữ liệu học (Hình 2a) là các hình ảnh được gán nhãn, sau đó khi đưa hình ảnh mới (Hình 2b) thì mô hình sẽ phân loại được là con thỏ.

Học không giám sát:

Học không giám sát là phương pháp học máy sử dụng dữ liệu không có nhãn. Các mô hình trong phương pháp này phân tích mối quan hệ (tương tự hay khác biệt), tần suất cùng xuất hiện,... của dữ liệu đầu vào nhằm khám phá các thông tin ẩn chứa trong dữ liệu. Các kĩ thuật học không giám sát bao gồm gom cụm, giảm chiều dữ liệu,... Trong đó, kĩ thuật gom cụm thường được ứng dụng để chia dữ liệu thành các nhóm dựa trên sự tương đồng của dữ liệu.

19 tháng 5

Ứng dụng của học máy trong việc lọc thư rác và dịch tự động:

a) Lọc thư rác

Việc phát hiện và lọc thư rác là vấn đề quan trọng đối với các nhà cung cấp dịch vụ email hiện nay. Các mô hình học máy có thể phân loại, nhận dạng văn bản, vì vậy được ứng dụng để lọc thư rác. Nhà cung cấp dịch vụ email như Gmail của Google hay Outlook của Microsoft đã sử dụng kết hợp nhiều mô hình học máy khác nhau trong các bộ lọc thư rác với nhiệm vụ học và phân loại các email là rác dựa trên những đặc trưng của email như từ khoả, cụm từ, thông tin về người gửi, tiêu đề, liên kết,...

b) Dịch tự động

Học máy đã và đang thay đổi ngành dịch thuật. Các mô hình học máy ngày càng hoàn thiện theo thời gian làm cho việc dịch thuật tự động trở nên dễ dàng hơn. Các công cụ dịch tự động của Google (Google Translate, Hình 4) hay Microsoft (Microsoft Translator) đều sử dụng mô hình học máy, có khả năng dịch văn bản. Dữ liệu phản hồi của người dùng khi xếp hạng chất lượng bản dịch cũng hỗ trợ mô hình học máy cải thiện độ chính xác. Các ứng dụng học máy cho phép thực hiện dịch tức thì các tệp văn bản, âm thanh và hình ảnh từ ngôn ngữ nguồn sang ngôn ngữ đích.

19 tháng 5

Trình bày các bước cơ bản của quá trình học của mô hình học máy:

1. Thu thập và chuẩn bị dữ liệu chứa các mẫu cần thiết cho bài toán cần giải quyết. Ví dụ, thu thập các email rác và email thường trong bài toán lọc thư rác. Dữ liệu thu thập cần đủ lớn và được chia làm hai phần. Phần thứ nhất dành cho mô hình học máy học, phần còn lại dùng để kiểm tra hiệu suất của mô hình.

2. Sử dụng các thuật toán để trích xuất các đặc trưng từ dữ liệu ở Bước D để làm đầu vào cho mô hình học máy cụ thể. Ví dụ, trích xuất các đoạn văn bản, từ khoá, chủ đề,... chứa các đặc điểm của thư rác hay thư thường trong các email.

3. Mô hình học máy sẽ học các tri thức từ các mẫu dữ liệu ở Bước 2 nhằm có thể dự báo, dự đoán, gom cụm,... Sau quá trình này, mô hình học máy đã tích luỹ tri thức để giải quyết bài

toán đã cho.

4. Sử dụng phần dữ liệu kiểm tra để đánh giá hiệu suất của mô hình. Nếu hiệu suất của mô hình chưa đạt, thì cần điều chỉnh mô hình để đạt kết quả tốt hơn.

5. Triển khai mô hình học máy.

19 tháng 5

- Học máy đóng vai trò to lớn trong các lĩnh vực y tế, giải trí, sản xuất kinh doanh:

Học máy có vai trò giúp máy tính thực hiện được các nhiệm vụ như: dự đoán kết quả dựa trên dữ liệu hiện tại, phân loại các đối tượng vào các lớp khác nhau; phân tích xu hướng tiêu dùng, diễn biến thị trường, tư vấn hay gợi ý sản phẩm dựa trên thói quen tìm kiếm, nhận dạng văn bản, hình ảnh, âm thanh,… xử lý ngôn ngữ tự nhiên trong chatbot, dịch thuật, phần mềm trợ lí ảo, tự động hoá quy trình sản xuất, hỗ trợ bác sĩ trong chuẩn đoán dựa trên việc phân tích hồ sơ bệnh án.

- Giới thiệu với các bạn một ứng dụng của học máy trong lĩnh vực giải trí: trợ lý ảo như Google Assistant của Google, Siri của Apple,…