Naive bayes adalah model machine learning yang digunakan untuk membedakan objek yang berbeda berdasarkan fitur tertentu. Secara sederhana, naive bayes mengasumsikan bahwa kehadiran fitur tertentu di kelas tidak terkait dengan kehadiran fitur lainnya. Algoritma ini mudah dibuat dan sangat berguna apabila dihadapkan dengan dataset yang besar. Contoh sederhana dari algoritma ini adalah sebuah buah dapat dikategorikan sebagai buah semangka jika berwarna hijau, bulat, dan berdiameter 10 ini.
Fitur-fitur ini dapat saling bergantung untuk keberadaannya. Namun, masing masing dari mereka secara independen berkontribusi pada kemungkinan bahwa buah yang dipertimbangkan adalah semangka. Maka dari itu, algoritma ini memiliki istilah “naive” di dalam namanya.
Algoritma naive bayes memiliki beberapa keuntungan yang membuatnya unggul dibandingkan dengan algoritma lain. Berikut beberapa keuntungannya:
- Algoritma ini bekerja sangat cepat dan dapat dengan mudah memprediksi kelas dari kumpulan data pengujian.
- Algoritma ini bisa digunakan untuk memecahkan masalah yang berhubungan dengan prediksi multi-kelas karena cukup berguna untuk menyelesaikannya
- Pengklasifikasi algoritma naive bayes berkinerja lebih baik daripada model lain dengan lebih sedikit training data jika asumsi independensi fitur berlaku
- Algoritma ini bekerja sangat baik dengan variabel input kategoris, dibandingkan dengan variabel numerik.
Tipe algoritma naive bayes
Naive bayes adalah algoritma yang banyak digunakan untuk membuat model machine learning dan memiliki keunikannya sendiri. Algoritma ini memiliki beberapa tipe, berikut beberapa tipenya:
- Bernoulli Naive Bayes
Pada algoritma ini, prediktor adalah variabel boolean. Dikarenakan prediktornya variabel boolean, maka satu-satunya nilai yang ada adalah benar atau salah. Algoritma ini digunakan ketika data sesuai dengan distribusi bernoulli multivariat.
- Naive Bayes Multinomial
Algoritma ini digunakan untuk memecahkan masalah klasifikasi dokumen. Contohnya, apabila ingin menentukan apakah suatu dokumen termasuk dalam suatu kategori, algoritma ini bisa digunakan untuk memilahnya. Naive bayes menggunakan frekuensi kata-kata sekarang sebagai fitur.
- Gaussian Naive Bayes
Algoritma ini digunakan apabila prediktor tidak diskrit namun memiliki nilai kontinu. Prediktor tersebut diasumsikan sebagai sampel dari distribusi gaussian.
Kegunaan naive bayes
Naive bayes memiliki banyak keuntungan sehingga banyak digunakan di berbagai aspek. Berikut beberapa kegunaan dari algoritma naive bayes:
1. Real time prediction
Naive bayes adalah algoritma pengklasifikasi pembelajaran yang bersemangat dan pasti cepat. Dengan demikian, algoritma ini dapat digunakan untuk membuat real time prediction.
- Multi class prediction
Algoritma ini juga terkenal dengan fitur multi class prediction. Algoritma ini dapat memprediksi probabilitas beberapa kelas variabel target.
- Text classification
Naive bayes banyak digunakan dalam text classification(karena hasil yang lebih baik dalam multi kelas dan aturan independensi) memiliki tingkat keberhasilan yang lebih tinggi dibandingkan dengan algoritma lain. Akibatnya, algoritma ini banyak digunakan dalam spam filtering dan sentiment analysis.
- Recommendation system
Algoritma naive bayes dan collaborative filtering bersama sama membangun sistem rekomendasi. Algoritma ini menggunakan machine learning dan data mining untuk menyaring informasi yang tidak terlihat dan memprediksi apakah pengguna menginginkan sumber daya yang diberikan atau tidak.
Tips untuk mengoptimalkan model naive bayes
Berikut beberapa tips untuk mengoptimalkan kekuatan model naive bayes:
- Jika fitur kontinu tidak memiliki distribusi normal, maka harus menggunakan transformasi atau metode yang berbeda untuk mengubahnya menjadi distribusi normal
- Hapus beberapa fitur yang berkorelasi. Dikarenakan fitur fitur yang sangat berkorelasi dipilih dua kali dalam model dan dapat menyebabkan kepentingan yang berlebihan
- Jangan menggabungkan teknik kombinasi pengklasifikasi lain seperti boosting karena tidak membantu. Dikarenakan naive bayes tidak memiliki varians untuk diminimalkan
Itu dia segala hal mengenai naive bayes. Ada banyak kegunaan dari algoritma ini yang bisa kamu terapkan pada model kamu. Apakah kamu tertarik dengan topik ini? Jika ya, ikuti terus blog Coding Studio.
Di internet sekarang ini memang hal ini sangatlah penting, sehingga Anda perlu mempelajarinya dengan baik dengan cara kursus. Sudah ada cukup banyak pilihan kursus juga yang bisa Anda pilih, dan semuanya bisa dibilang memiliki kelebihan masing-masing. Anda bisa mengikuti kursus algoritma dari coding studio.