Wednesday, June 14, 2017

Data Mining : Konsep dan Implementasi Naive Bayes

Tags

"The Capability to learn is a gift, the ability to learn is a skill, the willingness to learn is a choice" -Brian Herbert-

Belajar merupakan proses untuk menambah pengetahuan dan meningkatkan kapasitas, tak ada alasan untuk berhenti belajar meski sesulit apapun engkau memanajemen waktu. of course, saya setuju dengan hal ini. belajar bukan tentang siapa yang ingin berlomba-lomba membanggakan diri namun lebih pada kesadaran diri akan pentingnya penguasaan ilmu pengetahuan. seperti saya yang dengan tekun belajar di Universitas Potensi Utama *uhhukk uhhukkk.

come back again guys, pada kesempatan kali ini saya akan mengulas sedikit materi yang tentunya jika kamu adalah mahasiswa/i tingkat akhir  potensi utama (UPU) atau yang sedang tugas akhir saat ini, pasti sudah tidak asing lagi dengan mata kuliah Data Mining *ini loh mata kuliah yang suka buat pening. santai saja, saya tidak akan membahas sesuatu yang membuat masa depanmu suram apalagi sampai kelam.by the way, materi yang ingin saya sharing pada postingan saya ini adalah tentang Metode Naive Bayes.  sudah pada tahu kan ya? kalau belum, saya beri sedikit pengantar.

Menurut mbak Patil dan kawan-kawan(Patil dkk,2013), Naive Bayes merupakan sebuah metode yang digunakan untuk mengklasifikasikan probabilistik sederhana yang menghitung sekumpulan probabilitas dengan menjumlahkan frekuensi dan kombinasi nilai dari dataset yang diberikan serta mengasumsikan semua atribut independen atau tidak saling ketergantungan yang diberikan oleh nilai pada variabel kelas).  lebih jauh lagi, Naive Bayes didasarkan pada asumsi penyederhanaan bahwa nilai atribut secara konditional saling bebas jika diberikan nilai output. Dengan kata lain, diberikan nilai output, probabilitas mengamati secara bersama adalah produk dari probabilitas individu (Mujib dkk, 2013). Keuntungan penggunaan Naive Bayes adalah bahwa metode ini hanya membutuhkan jumlah data pelatihan (Training Data) yang kecil untuk menentukan estimasi paremeter yang diperlukan dalam proses pengklasifikasian. Naive Bayes sering bekerja jauh lebih baik dalam kebanyakan situasi dunia nyata yang kompleks dari pada yang diharapkan (Pattekari dan Parveen,2012).

adapun rumus yang digunakan dalam metode ini adalah :



Keterangan :
X                     : Data dengan class yang belum diketahui
H                     : Hipotesis data merupakan suatu class spesifik
P(H|X)             : Probabilitas hipotesis H berdasar kondisi X (posteriori
                          probabilitas)
P(H)                : Probabilitas hipotesis H (prior probabilitas)
P(X|H)             : Probabilitas X berdasarkan kondisi pada hipotesis H
P(X)                : Probabilitas X

well, dari pada banyak basa basi saya langsung kasih contoh penerapan nya saja. here we go guys ! 
 untuk menerapkan metode Naive Bayes Dalam suatu kasus, yang kamu butuhkan pertama kali adalah kumpulan dataset, di mana data tersebut kita butuhkan untuk melakukan pengujian. contoh dataset yang saya gunakan adalah sebagai berikut 


  dari data di atas saya bisa memberikan informasi bahwa data tersebut merupakan data penggunaan listrik rumah tangga, data tersebut merupakan data yang saya gunakan pada penelitian saya terdahulu *mumpung lagi panas-panasnya berita tentang kenaikan Tarif Dasar Listrik wkwwkwkwkw. selanjutnyasetelah dataset terkumpul, saatnya menentukan probabilitas setiap kriteria, ngomong-ngomong, dari dataset di atas kita bisa menyimpulkan bahwa kriteria yang akan digunakan meliputi Jumlah Tanggungan, Luas Rumah, Pendapatan, Daya Listrik, Perlengkapan dan yang terakhir adalah Penggunaan Listrik. perlu kalian ingat bahwa goal dari penerapan metode Naive Bayes dalam kasus listrik rumah tangga ini adalah untuk memprediksi penggunaan listrik rumah tangga. sehingga hasil penerapan ini dapat dijadikan acuan untuk mengendalikan penggunaan listrik agar tidak berlebihan. so, adapun contoh probabilitas berdasarkan dataset di atas sebagai berikut :
 
 Tabel di atas merupakan tabel yang menunjukan nilai probabilitas untuk kriteria Jumlah Tanggungan.

 
Tabel di atas menunjukan nilai probabilitas untuk kriteria Luas Rumah.
 
untuk tabel di atas menunjukan nilai probabilitas untuk kriteria Pendapatan.
 
 Tabel di atas menunjukan nilai probabilitas untuk kriteria Daya Listrik.
  
 Tabel di atas menunjukan nilai probabilitas untuk kriteria Perlengkapan.
 
Nah, Kalau tabel di atas menunjukan nilai probabilitas untuk Penggunaan Listrik yang mana probabilitas ini yang akan menentukan hasil dari metode Naive Bayes ini. *waduh...jangan pusing dulu ya masih panjang bro/sis. nilai probabilitas di atas diperoleh dari ke 60 data rumah tangga pada tabel dataset di awal.

dataset sudah, nilai probabilitas setiap kriteria sudah, langkah terakhir adalah menghitung prediksi penggunaan listrik rumah tangga.  untuk mengetahui hasil dari penerapan metode naive bayes ini, saya menggunakan aplikasi bantu yaitu Weka, di mana weka memudahkan saya dalam hal menghitung tiap probabilitas dan nilai akhir prediksi penggunaan rumah tangga *mau simple aja nih orang.

Taa...Daa...... dapat kalian lihat dari hasil penerapan metode Naive Bayes pada Weka. dari 60 data listrik penguna rumah tangga, dapat disimpulkan bahwa metode naive Bayes ini berhasil menghitung penggunaan listrik rumah tangga dengan nilai akurasi 78.3333% dan error sebesar 21.6667%. 

Finally, Sekian postingan saya mengenai Penerapan Metode Naive Bayes. materi di atas saya sajikan secara rinci dalam paper saya yang bisa kalian download disini. semoga bermanfaat dan sampai jumpa pada postingan selanjutnya,


sumber :
1. Patil,  T. R.,  Sherekar,  M. S.,  2013,  Performance Analysis of Naive Bayes and J48 Classification Algorithm for Data Classification, International Journal of Computer Science and Applications, Vol. 6, No. 2, Hal 256-261.

2.Pattekari,  S. A.,  Parveen, A.,  2012, Prediction System for Heart Disease Using Naive Bayes, International Journal of Advanced Computer and Mathematical Sciences,  ISSN 2230-9624, Vol. 3, No 3, Hal 290-294.

3.Ridwan, M., Suyono, H., Sarosa, M., 2013, Penerapan Data Mining untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes Classifier,  Jurnal EECCIS, Vol 1, No. 7, Hal. 59-64.


1 komentar so far

data training.a kanapa gk lengkap ya gan,,? butuh yang lebih lengkap ning,,, hehehe


EmoticonEmoticon