Weka adalah
aplikasi data mining open source berbasis Java. Aplikasi ini
dikembangkan pertama kali oleh Universitas Waikato di Selandia Baru
sebelum menjadi bagian dari Pentaho. Weka terdiri dari koleksi algoritma
machine learning yang dapat digunakan untuk melakukan generalisasi /
formulasi dari sekumpulan data sampling. Walaupun kekuatan Weka terletak
pada algoritma yang makin lengkap dan canggih, kesuksesan data mining
tetap terletak pada faktor pengetahuan manusia implementornya. Tugas
pengumpulan data yang berkualitas tinggi dan pengetahuan pemodelan dan
penggunaan algoritma yang tepat diperlukan untuk menjamin keakuratan
formulasi yang diharapkan.
Gambar 1 : Tampilan dashboard WEKA |
Empat tombol diatas dapat digunakan untuk menjalanankan Aplikasi :
- Explorer digunkan untuk menggali lebih jauh data dengan aplikasi WEKA
- Experimenter digunakan untuk melakukan percobaan dengan pengujian statistic skema belajar
- Knowledge Flow digunakan untuk pengetahuan pendukung
- Simple CLI antar muka dengan menggunakan tampilan command-line yang memungkinkan langsung mengeksekusi perintah weka untuk Sistem Operasi yg tidak menyediakan secara langsung
Setiap aplikasi dibuat untuk menyederhanakan suatu proses yang harus di buat oleh user, dalam hal ini ada beberapa fungsi utama dari Aplikasi WEKA antara lain adalah :
- Comprehensive set of data pre-processing tools, learning algorithms and evaluation methods
- Graphical user interfaces (incl. data visualization)
- Environment for comparing learning algorithms
Di kesempatan kali ini saya mengajak pembaca untuk dapat membuktikan langsung dengan mesin pencari kita mendapatkan begitu banyak fungsi dan dampak ketika Aplikasi Weka ini digunakan beberapa di antaranya adalah :
- Aplikasi Diagnosis Penyakit Kanker Payudara Menggunakan Algoritma Sequential Minimal Optimization
- Penerapan Association Rule Mining pada Data Bursa Efek Indonesia dengan Algoritma Apriori untuk Memilih Saham Unggulan
Lalu timbul pertanyaan dalam benak kita, kenapa kita harus belajar tentang WEKA itu sendiri, kenapa kitapun harus mengetahuinya setidaknya dalam hal-hal yang paling dasar?
Jawabannya adalah Aplikasi WEKA ini tuh bener-bener untuk eksplorasi yang udah menguasai Data Mining. Orang yang awam di bidang data mining, ketika pertama kali menggunakan WEKA, pasti tidak bisa memanfaatkan WEKA dengan maksimal. WHY ? Karena WEKA tidak memberikan sense kepada pengguna mengenai proses data mining.
Mungkin tetap dapat menggunakan tetapi pengolahan data tersebut tidak dapat digunakan dengan maksimal, jadi jawaban lengkapnya adalah ketika sayur tanpa garam tentu sayur tersebut dapat kita makan tetapi rasanya tawar dan tidak sedap begitu juga dengan WEKA, mungkin kita bisa menggunakan serta menginput suatu data sheet tetapi informasi yang maksimal yang mungkin kita dapat dari data sheet tersebut tidak terbuka semua jadi kita juga harus belajar mengenai Data Mining jadi WEKA = DATA MINING.
Dibawah ini saya akan mencoba salah satu fungsi dari WEKA dalam mengelolah suatu informasi sehingga menjadi suatu data baru yang dapat digunakan dalam mengelolah suatu data dan informasi.
1. Jalankan Program WEKA yang sudah di instal di PC / Laptop kita
2. Klik “Explorer” yang ada pada weka, jika sudah maka tampilan akan seperti gambar dibawah ini
3. Klik “Open File” yang ada pada weka, seperti gambar dibawah ini & pilih file of types dengan CSV data files (.csv) kemudian pilih data csv lalu open seperti gambar dibawah ini:
Jika sudah open maka tampilan akan seperti gambar dibawah ini:
4. Klik Save agar kita dapat ganti format csv tadi dengan format .arff
5. Jika sudah tersimpan dalam format .arff maka kita open kembali file tersebut dalam format yang baru, maka akan ada tampilan baru yang seperti ini
6. Lalu kita pilih "tress" kemudian klik "j48" dan selanjutnya kita klik start dan akan keluar hasilnya seperti dibawah ini
Dengan tingkat keberhasilan sekitar 37% dan error 63%
Karena tadi tingkat keberhasilan sangat kecil dan tingkat error sangat besar, maka saya mencoba lagi dengan persentasi split dengan 80%. Artinya 80% datanya menjadi training set kemudian sisanya yaitu 20% menjadi test set, kemudian klik start. Diperoleh hasil seperti gambar dibawah:
Dari model diatas dapat dibaca misal tear production rate nya reduced maka none (Hampir semua Puskesmas di DKI Jakarta sudah mempunyai rawat inap ) kemudian jika tear production rate nya normal ( artinya Puskesmas di DKI Jakarta rata-rata sudah mempunyai pelayanan rawat inap ) Jadi dapat di tarik kesimpulan untuk Fasilitas Tingkat Pertama di DKI jakarta sudah cukup baik untuk saat ini tinggal bagaimana mempertahankan dan membuat lebih baik lagi.
6. Yang paling terakhir adalah kita melihat visualisasi nya dengan cara klik kanan pada trees.j48 yang terakhir (karena yang terakhir tingkat keberhasilan nya 100%) kemudian pilih visualize tree. Seperti gambar dibawah ini:
Dari percobaan diatas disimpulkan bahwa Suatu analisa dalam pengambilan keputusan dapat dibantu dengan Tools WEKA ini dengan berbagai macam metode baik Metode Tree J48 maupun yang lain sebagainya.
Bagaimana pembaca semua tertarik untuk mencobanya ?
Comments