Thuật toán K-Mean trong bài toán Phân cụm dữ liệu
I. GIỚI THIỆU
Thuật toán K-means clustering do MacQueen giới thiệu trong tài liệu “J. Some Methods for Classification and Analysis of Multivariate Observations” năm 1967.
K-means Clustering là một thuật toán dùng trong các bài toán phân loại/nhóm n đối tượng thành k nhóm dựa trên đặc tính/thuộc tính của đối tượng (k £n nguyên, dương).
Về nguyên lý, có n đối tượng, mỗi đối tượng có m thuộc tính, ta phân chia được các đối tượng thành k nhóm dựa trên các thuộc tính của đối tượng bằng việc áp dụng thuật toán này.
Coi mỗi thuộc tính của đối tượng (đối tượng có m thuộc tính) như một toạ độ của không gian m chiều và biểu diễn đối tượng như một điểm của không gian m chiều. [Xem thêm...]
Tìm kiếm nội dung khác:
* Hướng dẫn tự học lập trình: C# | C/C++ | Java | Android | iOS (Swift) | JavaScript | Assembly | Python | PHP
* Chương trình ví dụ: Đồ họa máy tính | Cấu trúc dữ liệu và giải thuật | Toán rời rạc
* Tìm hiểu: Blockchain | Trí tuệ nhân tạo | Thuật toán di truyền | Học máy | Cơ sở dữ liệu | Phương pháp tối ưu
# BÀI VIẾT NỔI BẬT #
- [Algorithm] Thuật toán leo đồi (Hill Climbing Search)
- [Algorithms] Giới thiệu thuật toán Di truyền [GA]
- Treo máy kiếm tiền, có đáng tin cậy không?
- Hướng dẫn tự học Lập trình Windows với C# [2024]
- [C\C++] Ví dụ về Stack (sử dụng mảng tĩnh) [Ngăn xếp]
- [ C++ ] Tính đa hình, phương thức ảo, lớp trừu tượng trong C++ [Lập trình hướng đối tượng với C++]