Cara menggunakan XLMiner






Menghitung algoritma K-Means dengan XLMiner

XLMiner adalah data mining add-in yang komprehensif untuk excel, sebelum dilakukan instalasi aplikasi XLMiner, source aplikasi bisa diunduh di "https://www.solver.com/xlminer-data-mining". Apliaksi XLMiner yang akan diinstall disesuaikan dengan jenis sistem operasi yang digunakan. Proses instalasi sangat mudah untuk diikuti, sehingga instalasi aplikasi dapat dilakukan dengan cepat. 


Gambar 1 XLMiner ribbon tabs.

Data - Tab ini berisi Get Data Icon, untuk mengambil sampel dari worksheet atau database. Select File Folder untuk mengimpor kumpulam text document yang terletak didalam folder file. Big Data untuk menggunakan Apache Spark untuk mengimport Big Data ke dalam Excel.

Data Analysis - Tab ini mencakup 4 ikon : Explore, Transform, Cluster, dan Text. Explore digunakan untuk Chart Wizard, Feature Selection dan View existing charts.Transform untuk mengubah data sets dengan missing data, melakukan Binning, atau untuk mengubah data categorical. Cluster untuk melakukan analisis klaster menggunakan metode K-Means atau Hirarchical. Text untuk melakukan analisis pada kumpulan text document menggunakan fitur Text Miner.

Time Series - Tab ini mencakup tiga ikon : Partition, ARIMA, dan Smoothing. Fungsi-fungsi ini digunakan ketika menganalisis rangkaian waktu.

Data Mining - Tab ini mencakup empat ikon : Partition, Classify, Predict dan Associate. Fungsi-fungsi ini digunakan untuk melakukan aktivitas penambangan data.

Tools - Tab ini mencakup dua ikon : Score dan Help. Score untuk menilai data dalam basis data atau worksheet menggunakan klasifikasi atau algoritma prediksi. Help untuk periksa status lisensi, melihat contoh data set, melihat Help File, mengunduh panduan Pengguna, periksa pembaharuan, dan lihat informasi hak cipta yang terkait XLMiner.

1.      Buka aplikasi XLMiner, buat sheet baru sehingga muncul tampilan seperti gambar  berikut ini.


Gambar 2 Tampilan Awal XLMiner.
Keterangan :
a.       Process   : Lembar kerja untuk proses data mining.
b.      Operator : Tempat untuk memilih operator data mining.
c.       Model     : Tempat untuk melihat Model Spesifikasi.

2.      Masukan dataset kedalam area kerja XLMiner dengan cara memilih data "Get Data". Pilih data yang akan digunakan untuk data mining.


Gambar 3 Tampilan data yang akan digunakan untuk data mining.


3.      Setelah import data selesai, selanjutnya pilih menu Cluster kemudian pilih K-Means Clustering.


Gambar 4 Tampilan menu K-Means Clustering.

Tediri dari 3 langkah yaitu langkah pertama tentukan variabel yang nanatinya akan digunakan untuk klasterisasi, langkah ke dua tentukan parameter nya terdiri dari berapa cluster dan berapa iterasi, langkah ke tiga tentukan option output nya kemudian klik next.


Gambar 5 Hasil klasterisasi data pelanggan bagian input.



Dalam data input terdiri dari 4 bagian                                      
a.       Data menjelaskan mengenai sumber file (woorkbook), sheet yang digunakan (worksheet), range data yang di cluster dan  total record nya.
b.      Variables menjelaskan tentang selected variables yaitu variabel apa yang digunakan atau dipilih untuk meng-cluster data.
c.       K-Means Clustering : Fitting Parameters yaitu menjelaskan mengenai cluster (titik pusat yang digunakan) dan iterations (iterasi yang dilakukan dalam proses klasterisasi).
d.      K-Means Clustering: Reporting Parameters yaitu untuk menampilkan parameter output yang terdiri dari show data summary, show distance from each cluster dan normalized.


Gambar 6 Hasil klasterisasi data pelanggan bagian Cluster Centers.



Cluster Centers adalah titip pusat yang dipilih secara acak dari dataset sebagai cluster centers untuk menghitung jarak setiap dataset.


Gambar 7 Hasil klasterisasi data pelanggan bagian Inter Cluster Distance.



Inter Cluster Distance adalah jarak antar cluster atau titik pusat yang terdiri dari cluster 1, cluster 2 dan cluster 3.


Gambar 8 Hasil klasterisasi data pelanggan bagian Cluster Summary.

Cluster Summary dari dataset 35 data terdiri dari Cluster 1 beranggotakan 4 data, Cluster 2 beranggotakan 1 data dan Cluster 3 beranggotakan 30 data.


Gambar 9 Hasil klasterisasi data pelanggan Cluster Labels.

Cluster Labels adalah detail dari Cluster Summary ditampilkan semua dataset lengkap dengan cluster nya dan jarak dari setiap dataset ke titik pusat atau Cluster Centers.


Gambar 10 Scatterplot frekuensi belanja dan total belanja.



Scatterplot menunjukan sebaran titik yang mewakili klaster dari dataset, plot warna merah menunjukan pelanggan dengan frekuensi belanja 1 dan total belanja diatas 500 (lima ratus ribu rupiah).


Gambar 11 Scatterplot jumlah pelanggan dan total belanja.




Gambar 12 Scatterplot Total belanja.



Scatterplot total belanja yang memiliki frekuensi tinggi yaitu total belanja di antara 77 – 750 (tujuh puluh tujuh ribu rupiah – tujuh ratus lima puluh ribu rupiah).
Berdasarkan hasil perhitungan manual dan perhitungan menggunakan XLMiner dengan menggunakan titik awal pusat atau centroid yang berbeda, didapat hasil seperti dibawah ini.


Gambar 13 Hasil Klasterisasi Pelanggan Perhitungan Manual dan Perhitungan Menggunaakan XLMiner.



Pada pembahasan sebelumnya kita sudah menghitung algoritma K-Means dengan perhitungan manual yaitu menggunakan Ms.Excel dan sekarang kita mendapatkan hasil dari perhitungan dengan menggunakan XLMiner. Belum berhenti sampai disini karena ada perbedaan hasil dari 2 perhitungan tersebut maka langkah selanjutnya adalah PENGUJIAN HASIL / PENGUJIAN MODEL  ... see you next post ^^.

Comments

  1. Thank's for Share..
    Lanjutkan lagi share ilmunya ya...

    ReplyDelete

Post a Comment