Menghitung
algoritma K-Means dengan XLMiner
XLMiner adalah data mining add-in yang komprehensif untuk excel, sebelum dilakukan instalasi aplikasi XLMiner,
source aplikasi bisa diunduh di
"https://www.solver.com/xlminer-data-mining". Apliaksi XLMiner yang
akan diinstall disesuaikan dengan jenis sistem operasi yang digunakan. Proses
instalasi sangat mudah untuk diikuti, sehingga instalasi aplikasi dapat dilakukan
dengan cepat.
Gambar 1 XLMiner ribbon tabs.
Data - Tab ini berisi Get Data Icon, untuk
mengambil sampel dari worksheet atau database. Select File Folder untuk
mengimpor kumpulam text document yang terletak didalam folder file. Big Data
untuk menggunakan Apache Spark untuk mengimport Big Data ke dalam Excel.
Data Analysis
- Tab ini mencakup 4 ikon : Explore, Transform, Cluster, dan Text. Explore
digunakan untuk Chart Wizard, Feature Selection dan View existing
charts.Transform untuk mengubah data sets dengan missing data, melakukan
Binning, atau untuk mengubah data categorical. Cluster untuk melakukan analisis
klaster menggunakan metode K-Means atau Hirarchical. Text untuk melakukan
analisis pada kumpulan text document menggunakan fitur Text Miner.
Time Series
- Tab ini mencakup tiga ikon : Partition, ARIMA, dan Smoothing. Fungsi-fungsi
ini digunakan ketika menganalisis rangkaian waktu.
Data Mining
- Tab ini mencakup empat ikon : Partition, Classify, Predict dan Associate.
Fungsi-fungsi ini digunakan untuk melakukan aktivitas penambangan data.
Tools - Tab ini mencakup
dua ikon : Score dan Help. Score untuk menilai data dalam basis data atau
worksheet menggunakan klasifikasi atau algoritma prediksi. Help untuk periksa
status lisensi, melihat contoh data set, melihat Help File, mengunduh panduan
Pengguna, periksa pembaharuan, dan lihat informasi hak cipta yang terkait
XLMiner.
1.
Buka aplikasi
XLMiner, buat sheet baru sehingga muncul tampilan seperti gambar berikut ini.
Gambar 2 Tampilan Awal XLMiner.
Keterangan :
a.
Process : Lembar kerja untuk proses data mining.
b.
Operator :
Tempat untuk memilih operator data mining.
c.
Model : Tempat untuk melihat Model Spesifikasi.
2.
Masukan dataset
kedalam area kerja XLMiner dengan cara memilih data "Get Data". Pilih
data yang akan digunakan untuk data mining.
Gambar 3 Tampilan data yang akan digunakan untuk data
mining.
3.
Setelah import
data selesai, selanjutnya pilih menu Cluster kemudian pilih K-Means Clustering.
Gambar 4 Tampilan menu K-Means Clustering.
Tediri dari 3
langkah yaitu langkah pertama tentukan variabel yang nanatinya akan digunakan
untuk klasterisasi, langkah ke dua tentukan parameter nya terdiri dari berapa
cluster dan berapa iterasi, langkah ke tiga tentukan option output nya
kemudian klik next.
Gambar 5 Hasil klasterisasi data pelanggan bagian input.
Dalam data
input terdiri dari 4 bagian
a.
Data
menjelaskan mengenai sumber file (woorkbook), sheet yang
digunakan (worksheet), range data yang di cluster dan total record nya.
b.
Variables
menjelaskan tentang selected variables yaitu variabel apa yang digunakan
atau dipilih untuk meng-cluster data.
c.
K-Means
Clustering : Fitting Parameters yaitu menjelaskan mengenai cluster
(titik pusat yang digunakan) dan iterations (iterasi yang dilakukan
dalam proses klasterisasi).
d.
K-Means
Clustering: Reporting Parameters yaitu untuk menampilkan parameter output yang
terdiri dari show data summary, show distance from each cluster
dan normalized.
Gambar 6 Hasil klasterisasi data pelanggan bagian Cluster Centers.
Cluster Centers adalah titip pusat yang dipilih secara acak dari dataset sebagai cluster
centers untuk menghitung jarak setiap dataset.
Gambar 7 Hasil klasterisasi data pelanggan bagian Inter Cluster Distance.
Inter Cluster
Distance adalah jarak antar cluster atau titik pusat yang terdiri
dari cluster 1, cluster 2 dan cluster 3.
Gambar 8 Hasil klasterisasi data pelanggan bagian Cluster Summary.
Cluster Summary dari dataset 35 data terdiri dari Cluster 1 beranggotakan 4 data,
Cluster 2 beranggotakan 1 data dan Cluster 3 beranggotakan 30 data.
Gambar 9 Hasil klasterisasi data pelanggan Cluster Labels.
Cluster Labels
adalah detail dari Cluster Summary ditampilkan semua dataset lengkap
dengan cluster nya dan jarak dari setiap dataset ke titik pusat atau Cluster
Centers.
Gambar 10 Scatterplot frekuensi belanja dan total belanja.
Scatterplot menunjukan
sebaran titik yang mewakili klaster dari dataset, plot warna merah menunjukan
pelanggan dengan frekuensi belanja 1 dan total belanja diatas 500 (lima ratus
ribu rupiah).
Gambar 11 Scatterplot jumlah pelanggan dan total belanja.
Gambar 12 Scatterplot Total belanja.
Scatterplot total belanja
yang memiliki frekuensi tinggi yaitu total belanja di antara 77 – 750 (tujuh
puluh tujuh ribu rupiah – tujuh ratus lima puluh ribu rupiah).
Berdasarkan
hasil perhitungan manual dan perhitungan menggunakan XLMiner dengan menggunakan
titik awal pusat atau centroid yang berbeda, didapat hasil seperti
dibawah ini.
Gambar 13 Hasil Klasterisasi Pelanggan Perhitungan Manual dan Perhitungan
Menggunaakan XLMiner.
Pada pembahasan
sebelumnya kita sudah menghitung algoritma K-Means dengan perhitungan manual
yaitu menggunakan Ms.Excel dan sekarang kita mendapatkan hasil dari perhitungan
dengan menggunakan XLMiner. Belum berhenti sampai disini karena ada perbedaan
hasil dari 2 perhitungan tersebut maka langkah selanjutnya adalah PENGUJIAN
HASIL / PENGUJIAN MODEL ... see you next
post ^^.
Thank's for Share..
ReplyDeleteLanjutkan lagi share ilmunya ya...