Kết hợp các phương pháp phân cụm trong khai phá dữ liệu Web

Trong những năm ngành công nghệ thông tin đã có những bước phát triển chóng mặt. Do việc ứng dụng công nghệ thông tin vào hầu hết các lĩnh vực trong đời sống như: giáo dục, văn hóa, kinh tế, giải trí,… và sự tăng nhanh về số lượng người dùng Intenet trên toàn cầu. Đẫn đến việc bùng nổ, sự cập nhật nhanh chóng, liên tục của kh8 dữ liệu số đã đặt ra thách thức về việc khai thác,sử lý thông tin từ kho dữ liệu khổng lồ thành các tri thức có ích một cách nhanh chóng để phục vụ cho việc quản lý, hoạt động kinh doanh,… Để đáp ứng yêu cầu này người ta đã xây dựng các công cụ tìm kiếm và xử lý thông tin để giúp người dùng tìm kiếm được các thông tin cần thiết, nhưng so với sự rộng lớn về nguồn tài nguyên Web thì dẫn đến sự khó khăn với những kết quả tìm được.

Với các phương pháp khai thác cơ sở dữ liệu truyền thống chưa đáp ứng được đầu đủ các yêu cầu từ người dùng. Vì vậy một hướng đi mới đó là nghiên cứu và áp dụng kỹ thuật khai phá dữ liệu và khám phá tri thức trong môi trường Web. Do đó, việc nghiên cứu các mô hình dữ pháp khai liệu mới và áp dụng các phương phá dữ liệu trong khai phá tài nguyên Web là một xu thế tất yếu vừa có ý nghĩa khoa học vừa mang ý nghĩa thực tiễn cao.

Phân loại khai phá web

Với đề tài tốt nghiệp “Kết hợp các phương pháp phân cụm trong khai phá dữ liệu Web” tác giả đã chia đồ án thành 3 phần:

Chương 1: Trình bày các kiến thức cơ bản về khám phá tri thức, khai phá dữ liệu, một số vấn đề về biểu diễn và xử lý dữ liệu văn bản áp dụng trong khai phá dữ liệu.

Chương 2 : Giới thiệu một số thuật toán phân cụm dữ liệu phổ biến và thường được sử dụng trong lĩnh vực khai phá dữ liệu Web.

Chương 3: Trình bày khai phá nội dung Web và tiếp cận theo hướng sử dụng các kỹ thuật phân cụm dữ liệu để giải quyết bài toán khai phá dữ liệu Web. Trong phần này cũng trình bày một mô hình áp dụng kỹ thuật phân cụm dữ liệu trong tìm kiếm và phân cụm tài liệu Web.

Mời các bạn quan tâm tìm hiểu đồ án cùng chủ đề "Kết hợp các phương pháp phân cụm trong khai phá dữ liệu Web” của tác giả Cao Hữu Hải tại đường link: http://lib.hpu.edu.vn/handle/123456789/25202

Nhận xét