SVM: What is Support Vector Machine?

Support Vector Machine (SVM) merupakan salah satu algoritma machine learning yang berguna untuk menyelesaikan masalah klasifikasi.

Misalnya kita punya data seperti pada gambar dibawah ini. Ada dua atribut input Tinggi dan Berat Badan dan sebuah atribut output Jenis Kelamin(Laki-laki/Perempuan). Kita ingin mengklafisikasikan data baru apakah Laki-laki/Perempuan.

Kalo ada sebuah data baru seperti ini, kira-kira output Laki-laki atau Perempuan?

Kalo ini?

Dan kalo ini?

 

Bingung kan lo yang terakhir? Kenapa bingung, karena data baru tersebut berapa pada daerah peralihan antara Laki-laki dan Perempuan. Semakin jauh suatu data baru dari daerah peralihan ini maka kita akan semakin yakin terkait klasifikasi yang kita buat, begitu pula sebaliknya. Lalu seperti apa bentuk daerah peralihan tersebut?

Sebenarnya kita bisa saja membuat sebuah garis yang membagi dua area seperti pada gambar berikut. Garis tersebut membagi dua kelas sehingga semua instance yang kelasnya Laki-laki berada pada sisi kanan dan semua instance yang kelasnya Perempuan berada pada sisi kiri. Jika ada data baru pada area sebelah kanan maka outputnya Laki-laki, dan jika pada area sebelah kiri maka outputnya Perempuan.

Tapi masalahnya, ada banyak kemungkinan untuk membuat garis  tersebut. Garis tersebut bisa digeser sedikit keatas atau kebawah, atau dirotasi, tanpa mengubah hasil klasifikasi. Lalu mana yang harus kita pilih?

Oke, kita coba satu-satu. Bagaimana jika hyperplane yang ini?

Ups, ternyata ketika ada data baru klasifikasi yang dihasilkan pada salah.

Oleh karena itu, hyperplane yang kita pilih ialah yang paling jauh dari kedua kelas, tidak condong ke salah satu kelas, baik kelas Laki-laki maupun Perempuan. Hal ini akan menghasilkan generalisasi yang lebih baik.

Maximal Margin Classifier

Dari sebuah hyperplane, kita bisa mengukur jarak antara hyperplane tersebut dengan data yang paling dekat. Nah yang disebut dengan margin merupakan dua kali jarak antara hyperplane dengan titik terdekatnya.

Semakin condong suatu hyperplane terhadap suatu titik terdekat maka semakin kecil pula marginnya. Terlihat pada gambar di bawah ini, margin hyperplane yang Dan satu catatan bahwa tidak ada instances yang terletak dalam margin.

Tujuan dari SVM ini ialah bagaimana menemukan hyperplane yang optimal, yang memiliki margin yang paling besar. Dengan margin yang besar ini diharapkan hasil generalisasi akan lebih baik sehingga dapat meningkatkan akurasi classifier. Dan titik-titik yang terdekat dengan hyperplane disebut support vector, karena perubahan yang terjadi pada titik-titik ini maka dapat pula mengubah hyperplane.

One thought on “SVM: What is Support Vector Machine?

Leave a Reply

Your email address will not be published. Required fields are marked *