Mengenal Support Vector Machine dan Cara Kerjanya

Support Vector Machine adalah salah satu metode dalam supervised learning yang biasanya digunakan untuk klasifikasi ataupun regresi. Dalam pemodelan klasifikasi, support vector machine memiliki konsep yang lebih matang serta jelas secara matematis dibandingkan dengan teknik klasifikasi lainnya. Support vector machine juga dapat mengatasi masalah klasifikasi dan regresi dengan metode linear maupun non linear.

support-vector-machine
Photo by towardsdatascience.com

Algoritma support vector machine digunakan untuk mencari hyperplane terbaik dalam ruang N-dimensi yang secara jelas mengklasifikasikan titik data. Hyperplane adalah sebuah fungsi yang digunakan sebagai pemisah antar kelas yang satu dengan yang lain. Fungsi ini digunakan untuk mengklasifikasikan di dalam ruang kelas dimensi yang lebih tinggi.

Dalam bentuk 2 dimensi, fungsi yang digunakan untuk mengklasifikasikan antar kelas disebut dengan line whereas. Sedangkan fungsi yang digunakan untuk mengklasifikasikan antar kelas dalam bentuk 3 dimensi disebut plane similarly.

Terdapat beberapa keuntungan dari penggunaan algoritma ini:

  1. Support vector machine sangat membantu apabila tidak memiliki banyak ide tentang data. 
  2. Dapat digunakan untuk data yang tidak berdistribusi teratur dan tidak diketahui distribusinya.
  3. Algoritma ini memiliki teknik yang sangat berguna untuk memecahkan masalah kompleks apa pun, yang disebut kernel.
  4. Tidak mengalami kondisi overfitting dan bekerja dengan baik bila ada indikasi pemisahan yang jelas.
  5. Mampu menangani data berdimensi tinggi.
  6. Algoritma support vector machine memiliki tingkat akurasi yang lebih baik dan melakukan prediksi lebih cepat.
  7. Dapat diterapkan pada model pembelajaran semisupervised.
  8. Memiliki kompleksitas komputasi yang lebih baik dibandingkan dengan algoritma lain. 
  9. Dapat digunakan walaupun sampel pelatihan data memiliki bias.
  10. Memiliki kemampuan untuk menormalkan data.

Cara kerja support vector machine

Seperti yang dijelaskan diatas bahwa support vector machine adalah sebuah algoritma yang digunakan untuk mencari hyperplane terbaik diantara dataset. Untuk mendapatkan pemahaman lebih jelas terkait cara kerja support vector machine terdapat sebuah contoh. 

support-vector-machine
Photo by towardsdatascience.com

Dapat dilihat pada gambar di atas, ibaratkan terdapat sebuah dataset. Pada gambar tersebut, terlihat ada kotak merah dan juga lingkaran biru. Support vector machine akan digunakan untuk mencari garis ideal yang membagi kedua kelas dataset tersebut. Dilihat pada gambar tersebut terdapat dua kandidat garis yang membagi kedua kelas tersebut, yaitu garis hijau dan juga kuning.

Baca Juga:  Broadcast Adalah: Pengertian, Manfaat, Jenis dan Contohnya

Sekilas, terlihat bahwa garis kuning merupakan garis yang ideal untuk membagi kedua kelas tersebut. Dikarenakan posisinya yang terletak di tengah, berbeda dengan garis hijau yang terlihat lebih dekat ke kotak merah. Namun itu baru asumsi saja, untuk melihat garis mana yang paling terbaik digunakanlah algoritma support vector machine ini. 

support-vector-machine
Photo by towardsdatascience.com

Sesuai dengan algoritma support vector machine, pertama ditentukan terlebih dahulu titik yang paling dekat dengan garis dari kedua kelas. Titik tersebut disebut dengan support vector. Setelah ditentukan, maka akan dihitung jarak antara garis dan support vector tersebut. Jarak ini dinamakan dengan margin. Tujuan dari algoritma ini adalah memaksimalkan margin yang ada, sehingga mendapatkan garis/hyperplane yang optimal.

Nah, itu dia segala hal mengenai support vector machine, sebuah algoritma yang digunakan untuk mengklasifikasikan sebuah kelas. Dengan mempelajari algoritma ini, nantinya kamu bisa untuk mengklasifikasikan sebuah kelas dari dataset yang kamu miliki. Maka dari itu, kamu harus mulai mempelajari algoritma ini dari sekarang. Kalau kamu masih belum punya basic sama sekali tapi ingin belajar algoritma sampai jago bisa gabung member coding studio di kursus algoritma.

Apakah kamu menyukai topik ini? Jika ya, ikuti terus blog Coding Studio untuk menambah pengetahuanmu di bidang data!