web site hit counter

Tesis Komparasi dan Integrasi Algoritma Klasifikasi Machine Learning Dan Feature Selection

Course

Tesis Komparasi dan Integrasi Algoritma Klasifikasi Machine Learning Dan Feature Selection

(0 vote average: 0 out of 5) 193 VIEWS Skripsi

COURSE DETAILS

Analisis sentimen merupakan proses yang bertujuan untuk menentukan isi dari dataset yang berbentuk teks bersifat positif, negatif atau netral. Pendapat khalayak umum menjadi sumber yang penting dalam pengambilan keputusan seseorang akan suatu produk. Algoritma klasifikasi seperti Naïve Bayes (NB), Support Vector Machine (SVM), dan Artificial Neural Network (ANN) diusulkan oleh banyak peneliti untuk digunakan pada analisis sentimen review film. Namun, klasifikasi sentimen teks mempunyai masalah pada banyaknya atribut yang digunakan pada sebuah dataset. Feature selection dapat digunakan untuk mengurangi atribut yang kurang relevan pada dataset. Beberapa algoritma feature selection yang digunakan adalah information gain, chi square, forward selection dan backward elimination. Hasil komparasi algoritma, SVM mendapatkan hasil yang terbaik dengan accuracy 81.10% dan AUC 0.904. Hasil dari komparasi feature selection, information gain mendapatkan hasil yang paling baik dengan average accuracy 84.57% dan average AUC 0.899. Hasil integrasi algoritma klasifikasi terbaik dan algoritma feature selection terbaik menghasilkan accuracy 81.50% dan AUC 0.929. Hasil ini mengalami kenaikan jika dibandingkan hasil eksperimen yang menggunakan SVM tanpa feature selection. Hasil dari pengujian algoritma feature selection terbaik untuk setiap algoritma klasifikasi adalah information gain mendapatkan hasil terbaik untuk digunakan pada algoritma NB, SVM dan ANN. Proses pengurangan atribut yang kurang relevan menggunakan algoritma feature selection terbukti dapat meningkatkan accuracy dibanding dengan menggunakan metode klasifikasi saja. Namun ada beberapa faktor yang dapat dikembangkan untuk penelitian selanjutnya, yaitu: Analisis sentimen untuk review film mengacu pada jenis film tertentu saja. Pernyataan pada salah satu jenis film, mungkin akan berbeda maknanya dengan jenis film yang lain. Seperti, review film sedih pada jenis film drama termasuk review positif, tetapi pada jenis film komedi review sedih termasuk review yang negatif. Analisis sentimen pada penelitian ini belum memperhatikan semantik, yaitu makna kata dan kalimat. Penelitian selanjutnya dapat menggunakan makna kata dan kalimat untuk menentukan sentimen suatu dokumen agar didapat hasil yang lebih baik.



COMMENTS