Analisis
gerombol (Cluster analysis) adalah suatu teknik analisis
multivariate yang digunakan untuk mengidentifikasikan dan mengelompokkan
individu/obyek yang memiliki kemiripan ke dalam kelompok-kelompok tertentu.
Dengan demikian, individu/obyek dalam satu kelompok yang sama akan
memiliki kemiripan satu dengan yang lainnya berdasarkan beberapa kriteria
pemilihan yang telah ditetapkan sebelumnya (homogen). Sedangkan individu/obyek
dalam kelompok yang berlainan memiliki sifat yang berbeda (heterogen). Jadi,
apabila pengelompokkan yang terjadi cukup baik, maka apabila diilustrasikan
secara geometris melalui plotting data, obyek dalam satu gerombol akan terlihat
berdekatan dan obyek dalam gerombol yang berbeda akan terlihat berjauhan
letaknya.
Analisis gerombol merupakan suatu
teknik yang sangat berguna di berbagai situasi/keperluan. Sebagai contoh,
seorang peneliti yang telah mengumpulkan data melalui sebuah kuesioner
adakalanya dihadapkan dengan sejumlah besar observasi yang belum memiliki arti
apa-apa sebelum dikelompokkan ke dalam beberapa grup yang teratur. Dengan
menggunakan analisis gerombol nantinya peneliti tersebut akan memperoleh
gambaran yang lebih jelas mengenai observasi yang dia miliki melalui kelompok-kelompok
yang lebih kecil.
Analisis
gerombol bertujuan untuk
- Mengelompokkan individu/obyek berdasarkan persamaan karakteristik di antara individu/obyek tersebut
- Mengetahui apakah berdasarkan variabel-variabel tertentu dapat dibentuk kelompok-kelompok dimana kelompok tersebut mempunyai ciri yang berbeda antara satu dengan lainnya, sedangkan individu/obyek dalam satu kelompok yang sama mempunyai sifat yang homogen.
Beberapa contoh akan memperjelas
kegunaan dari analisis gerombol,
- Seorang peneliti ingin mengetahui segmen-segmen pasar yang ada di suatu komunitas tertentu. Misalkan suatu random sampel dipilih dari populasi tersebut dan informasi yang dikumpulkan adalah tingkat pendidikan dan brand loyalty.
- Pengelompokkan antara desa tertinggal dan desa tidak tertinggal berdasarkan karakteristik/indikator ekonomi dan kesejahteraan rakyat.
- Pengelompokkan daerah yang tahan pangan dan daerah yang tidak tahan pangan berdasarkan variabel-variabel produksi pertanian, indikator kesejahteraan rakyat, dan lain-lain.
Dalam
analisis gerombol, ada beberapa tahapan yang harus dilalui, yaitu:
Partitioning
(pembuatan partisi)
Partitioning, merupakan proses untuk
menentukan bagaimana kelompok-kelompok dapat dibentuk. Tahapan ini meliputi dua
langkah, yaitu
Pengukuran kemiripan, yaitu mengukur seberapa mirip
individu/obyek yang ada. Biasanya untuk menentukan kemiripan ini digunakan
ukuran jarak antara individu/obyek. Metode pengukuran jarak yang sering digunakan
adalah jarak Euclidean (Euclidean distance).
Algoritma pengelompokkan, yang dapat dibagi dua cara, yaitu:
Hierarchical, yang meliputi metode agglomerative dan divisive. Jumlah
kelompok yang akan terbentuk dengan cara ini tergantung dari karakteristik
individu/obyek berdasarkan variable-variabel yang digunakan.
Dalam metode agglomerative, ada beberapa prosedur yang bias
digunakan, yaitu prosedur pautan tunggal (single linkage), prosedur
pautan lengkap (complete linkage), prosedur pautan rata-rata (average
linkage), metode Ward, dan berdasarkan centroid.
Non hierarchical, dimana jumlah kelompok yang akan dibentuk ditentukan sendiri oleh
pengguna. Penentuan jumlah kelompok yang dibentuk biasanya didasarkan oleh
suatu teori atau anggapan tertentu.
Interpretasi. Langkah ini merupakan proses untuk
mengetahui karakteristik dari masing-masing kelompok yang terbentuk.
Profiling. Tahap
ini merupakan proses untuk menggambarkan/memprofilkan
karakteristik-karakteristik dari masing-masing kelompok dan bertujuan untuk
menjelaskan bagaimana kelompok-kelompok yang terbentuk tersebut berbeda.
No comments:
Post a Comment