pengertian istilah dalam DATA MINING
Clustering
Clustering merupakan proses pengelompokan suatu objek ke dalam suatau class atau kelompok objek yang memiliki kemiripan. Sebuah cluster sendiri terdiri dari data yang memiliki kesamaan antara satu dengan yang lainnya dan apabila terdapat perbedaan maka akan dikelompokkan ke dalam cluster yang berbeda.
Semi-supervised Learning
- Unsupervised Learning adalah proses suatu system mempelajari unlabeled data berdasarkan fitur-fitur dari data tersebut, Tujuan akhir dari Unsupervised Learning adalah mengelompok data-data ke dalam suatu grup yang berupa cluster terdiri dari data yang memiliki kemiripan yang sama untuk satu cluster dan apabilan ditemukan perbedaan dapat dikelompokkan ke dalam cluster yang lain atau dapat dianggap sebagai outlier.
- Supervised Learning adalah proses suatu system mempelajari labeled data sebagai training set yang terdiri dari fitur dan label. Tujuan akhir dari supervised learning adalah untuk mengidentifikasi label input yang baru dengan fitur yang ada pada data baru tersebut.
- Semi-supervised Learning adalah proses suatu system untuk mempelajari labeled data dan unlabeled data secara bersamaan untuk dijadikan data training. Semi-supervised clustering sendiri adalah menggunakan sedikit labeled data dan unlabeled data untuk dikelompokkan ke dalam suatu cluster.
Comments ()