Analisis Cluster untuk
Data Mining
A. PENDAHULUAN
Analisi cluster merupakan metode yang
sangat penting untuk menggolongkan berbagai item kedalam pengelompokkan umum
yang disebut cluster. Metode ini umum
didalam biologi, kedokteran, genetika, ilmu sosial, ilmu antropologi, arkelogi,
astronomi, pengenalan karakter dan bahkan dalam pengembangan MIS. Sebagaimana
popularitas data mining meningkat,
berbagai metode pun telah diberlakukan bagi bisnis, terutama pemasaran. Analisis
cluster telah digunakan secara ekstensif untuk deteksi penipuan, penipuan kartu
kredit, e-commerce dan segmentasi pasar pelanggan didalam sistem CRM. Lebih
banyak aplikasi didalam bisnis terus dikembangkan ketika kekuatan analisis
cluster dipahami dan digunakan.
B. Analisi Cluster untuk Analisis Data
Analisis cluster adalah suatu alat
analisa data untuk memecahkan masalah penggolongan. Tujuannya adalah mengrutkan
kasus ( orang, benda, peristiwa, dll) kedalam kelompok atau cluster, sehingga
tingka asosiasi kuat antara anggota dari cluster yang sama dan lemah diantara
anggota dari cluster yang berbeda. Masing – masing cluster menguraikan kelas
anggota yang ia miliki. Contoh satu dimensi dari analisis cluster adalah
membuat range skor untuk menentukan tingkat suatu kelas perguruan tinggi. Ini serupa
dengan masalah analisis cluster yang dihadapi oleh Departemen Keuangan AS
ketika menetapka tarif pajak baru pada 1980-an. Suatu contoh fiksi tentang
cluster pada buku karya J. K. Rowling, Harry
Potter. Sorting Hat menentukan siswa tahun pertama di Hogwarts School.
Contoh lain melibatkan bagaimana menempatkan para tamu pada suatu perkawinan.
Sebagaimana data mining terus berkembang, analisis cluster terus menjadi
penting karena ia memungkinkan pengungkapan struktur dan asosiasi didalam data yang sebelumnya tidak diketahui,
sehingga menjadi bermanfaat dan masuk akal begitu data tersebut ditemukan.
Hasil
analisis cluster digunakan untuk :
·
Membantu
mengindentifikasikan suatu rencana penggolongan (misal, jenis pelanggan)
·
Menyarankan
model statistik untuk menggambarkan populasi
·
Mengindikasikan
aturan untuk menugaskan kasus baru pada kelas-kelas untuk identifikasi, target
dan tujuan diagnostik.
·
Menyediakan
ukuran-ukuran definisi, ukuran dan perubahan terhadap keluasaan konsep
sebelumnya.
·
Menemukan
kasus umum untuk merepresentasikan kelas-kelas
C. Metode – Metode Analisis Cluster
Analisis cluster dapat didasarkan
pada suatu atau lebih metode umum berikut ini:
·
Statistik
(termasuk hierarki dan nonhierarki)
·
Optimal
·
Jaringan
saraf
·
Fuzzy
logic
·
Algoritma
genetika
Masing – masing metode ini biasanya
bekerja dengan salah satu dari dua kelas metode berikut ini :
·
Divisive : semua item memulai pada suatu cluster
dan dipisahkan
·
Agglomerative : semua item memulai pada cluster
individu, dan cluster – cluster yang bekerja bersama.
Kebanyakan metode analisis cluster
meibatkan penggunaan suatu jarak antara sepasang item. Artinya ada ukuran
persamaan antara setiap suatu pasang item untuk dikelompokkan. Sering mereka
berdasar jarak sesungguhnya yang diukur tetapi tidak perlu seperti itu, seperti
yang umum terjadi pada kasus pengembangan SI. Rata – rata bobot dapat digunakan
untuk menetapkan jarak. Sebagai contoh pada sebuah proyek pengembangan SI,
modul individu dari sistem mungkin terkait dengan persamaan antara input,
output, proses dan data spesifik yang digunakan. Faktor ini kemudian
dikumpulkan dan dipasangkan berdasarkan item kedalam suatu ukuran jarak
tunggal.
D. Perangkat Lunak Analisis Cluster
Selain data mining dimana metode analisis cluster dilekatkan, ada
beberapa paket khusus untuk analisis cluster, meliputi :
·
ClustanGraphies
(Clustan)
·
Decision
WORKS Suite (Advanced Software Application)
·
SPSS
·
Poly
Analyst Cluster Engine (Megaputer)
·
Sokal
code
E. Analisis Cluster yang Efektif /
aplikasi Data Mining
Goulet dan Wishart (1996) menyediakan
contoh yang baik bagaimana suatu bank dapat menggolongkan pelanggannya untuk
secara dramatis meningkatkan jasa keuangan mereka. Co-Operative Movement
Desjardin’s menjadi institusi perbankan yang paling besar di Qubec (Canada).
Ketika analisis ini dilaksanakan, ada 1329 cabang dan 4,2 juta anggota.
Organisasi telah menggabungkan aset lebih dari $80 miliar (Canada). Ia sedang
dalam proses layanan teller, meningkatkan penggunaan ATM dan metode TI lain, ia
juga menawarkan produk dan jasa yang mencakup asuransi jiwa dan properti dan
beberapa yang lain. Karena masing-masing cabang mandiri, maka Confederation
perlu menjual produknya kepada cabangnya dan anggotanya. Pada awal studi para
eksekutif bank menyadari bahwa mereka memerlukan tipologi anggota tidak hanya
untuk mempertahankan loyalitas pelanggan, tetapi juga unutuk menangkap lebih
banyak pangsa pasar dengan mengindentifikasi layanan yang profitabel untuk
memuaskan kebutuhan anggota dan meningkatkan penetrasi pasar.
Bank
melakukan analisis cluster terhadap contoh 16.000 anggota. Dengan melakaukan
hal tersebut ia mengenali 16 variabel yang mencerminkan karakteristik pola
transaksi keuangan. 30 jenis anggota berhasisl dikenali. Erikutnya 4,2 juta
anggota (semuanya) digolongkan sesuai dengan 16 ukuran yang digunakan untuk
menempatkan mereka kedalam satu atau lebih 30 cluster anggota.
Sekarang
para manajer dan analis keuangan dapat mengindentifikasi anggota yang transaksi
keuangannya ada diantara satu atau lebih dari 30 cluster tersebut. Dengan
cluster anggota tertentu, profitabilitas setiap cluster transaksi dan akun
pelanggan individu dapat diukur. Masing-masing manajer cabang dapat melihat
pelangannya sebagai investasi pada sebuah portofolio dan segmen pasar tertentu
untuk produk dan layanan cabang pun telah dikenalai.
Hasilnya
mengesankan. Bank dapat mengindentifikasi anggota dengan volume transaksi besar
dalam satu akaun dengan mencocokannya dengan asuransi atau pinjaman mereka
lainnya. Para manajer kemudian bisa menyarankan konsolidasi yang lebih ekonomis
terhadap investasi dan pinjaman anggota, dengan demikian mendorong kearah
tingkat kepuasan pelanggan yang lebih tinggi. Lagipula para manajer dapat
menyarankan diverifikasi yang lebih terhadap investasi anggota.
Akan tetapi hasil paling mengesankan
adalah usaha pemasaran bank. Bank dapat fokus pada produk dan jasa yang
mempuyai perforna keuangan yang terbaik dan menargetkannya kepada pelanggan
yang sesuai. Hal ini mengurangi biaya surat dan kontak. Tingkat respon
ditingkatkan dengan menargetkan promosi produk yang menuju kepada pemerekan
yang lebih baik dan kepad retensi pelanggan. Sesungguhnya lebih banyak
pelanggan profitabel yang dapat dipertahankan pada biaya yang lebih sedikit.
Tidak ada komentar:
Posting Komentar