K-Means Cluster [Part 1]: Diterapkan dengan mudah dalam penelitian Skripsi, Tesis dan Disertasi
K-Means Cluster: Easily applied in Thesis and Dissertation research
Sehat selalu sobatku, damai dan bahagia selalu. Kali ini penulis berbagi pengetahuan mengenai penerapan salah satu analisis cluster yaitu K-Means Cluster yang disajikan secara sederhana dan mudah diterapkan dalam penelitian secara umum maupun penelitian dilingkup perguruan tinggi seperti penelitian skripsi, tesis maupun disertasi. Dalam tulisan kali ini penulis terlebih dahulu menghadirkan konsep, dan hal-hal penting dalam analisis K-means clustering.
Definisi
Tan, 2006
Clustering atau yang sering dsebut klasterisasi merupakan teknik atau metode dalam pengelompokkan data. Jadi menurut Tan proses clustering merupakan upaya mengelompokkan data dalam beberapa kelompok atau beberapa cluster sehingga dalam satu cluster terdapat tingkat kemiripan yang maksimal dan data antar cluster atau antar kelompok mempunyai kemiripan yang minimum (sangat berbeda).
Singgih Santoso (2012)
Metode K-Means merupakan analisis cluster dengan cara memproses semua objek (kasus) secara sekaligus. Proses ini dimulai dengan penentuan jumlah cluster terlebih dahulu, misalnya ditentukan akan ada 2 cluster atau 3 cluster atau angka lainnya.
Jhonson dan Wichern (2005)
Dikutib dari Mochamad Wahyudi, Masitha, Risna Saragih, Solikhun (2020) Metode K-Means digunakan sebagai alternatif metode klaster untuk data dengan ukuran yang lebih besar. Hal ini dikarenakan metode ini memiliki kecepatan yang lebih tinggi jika dibandingkan metode hirarkhi.
Ramdhani dan Hoyyi (2015)
Dikutib dari Mochamad Wahyudi, Masitha, Risna Saragih, Solikhun (2020) Metode K-Means dapat digunakan untuk menjelaskan algoritma dalam penentuan suatu objek kedalam kluster tertentu berdasarkan rataan terdekat.
Mochamad Wahyudi, Masitha, Risna Saragih, Solikhun (2020)
K-Means merupakan salah satu metode data clustering non hirarkhi yang berusaha mempartisi data yang ada kedalam bentuk satu atau lebih cluster atau kelompok sehingga data yang memiliki karakteristik yang sama di kelompokkan ke dalam satu kluster yang sama dan data yang mempunyai karakteristik yang berbeda dikelompokkan kedalam kelompok lainnya.
Kelebihan dan Kelemahan K-Means Cluster
Kelebihan K-Means Cluster
Dalam implementasi menyelesaikan masalah, algoritma K-Means Clustering sangat simple serta fleksible. Artinya perhitungan komputasinya tidak terlalu rumit dan algoritma ini dapat diimplementasikan pada segala bidang. Algoritma K-Means Clustering sangat mudah dipahami terutama dalam implementasi data yang sangat besar serta dapat mengurangi kompleksitas data yang dimiliki (Prianto dan Bunyamin, 2020).
Kelemahan K-Means Cluster
Kelemahan yang dimiliki K-Means Clustering yaitu memerlukan angka yang tepat dalam menentukan cluster sebanyak k karena terkadang pusat cluster awal dapat berubah sehingga kejadian ini bisa mengakibatkan pengelompokkan data menjadi tidak stabil.
Referensi lainnya
- https://www.dqlab.id/k-means-clustering-salah-satu-contoh-teknik-analisis-data-populer
- https://en.wikipedia.org/wiki/K-means_clustering
- https://www.trivusi.web.id/2022/06/algoritma-kmeans-clustering.html
- https://towardsdatascience.com/understanding-k-means-clustering-in-machine-learning-6a6e67336aa1 • https://algorit.ma/blog/k-means-clustering-2022/
- https://medium.com/@afrizalfir/kmeans-clustering-dan-implementasinya-5e967dc604cf
Analisis cluster sangat bermanfaat dalam sebuah pemetaan (mepping) untuk mempelajari karakteristik suatu objek tertentu. Situasi dan kondisi akan di potret menggunakan analisis cluster sehingga akan lebih mudah mengenali objek dan memberikan informasi yang penting dalam mendukung keakuratan penelitian.
Tulisan ini merupakan part 1 dari 3 part yang penulis rencanakan untuk menjelaskan analisis cluster. Sengaja penulis buat menjadi 3 part agar dapat di pahami lebih jelas. Contoh yang nantinya dihadirkan juga merupakan sebuah ilustrasi. Setelah tulisan ini kemudian akan ada tulisan lannya mengenai analisis cluster dengan metode Hierarchical Cluster.
Tulisan ini penulis sajikan guna membantu sahabat yang ingin menggunakan analisis cluster dalam penelitiannya. Silahkan di baca juga berbagai tulisan yang sekiranya dibutuhkan dalam blog ini. Penulis mengucapkan terima kasih telah mengunjungi blog ini. Sehat selalu dan bahagia.