Klasifikasi Berita Politik Menggunakan Algoritma K-nearst Neighbor
Abstract
Klasifikasi konten berita politik menggunakan algoritma K-Nearest Neighbor merupakan suatu proses untuk mengklasifikasikan berita politik ke dalam tiga subkategori yang lebih spesifik yaitu pilkada, UU ORMAS dan reshuffle kabinet. Algoritma yang digunakan dalam penelitian ini adalah algoritma K-Nearest Neighbor. Algoritma K-Nearest Neighbor merupakan suatu pendekatan klasifikasi yang mencari semua data training yang paling relatif mirip atau memiliki jarak yang paling dekat dengan data testing. Algoritma ini dipilih karena K-Nearest Neighbor merupakan algoritma yang sederhana dengan mencari kategori mayoritas sebanyak nilai K yang telah ditentukan sebelumnya. nilai K yang digunakan pada penelitian ini adalah K=3, K=5, K=7 dan K=9. Mekanisme dari sistem klasifikasi konten berita ini dimulai dengan tahap preprocessing. Berita politik yang dimasukkan kedalam sistem akan melewati empat tahap preprocessing yaitu case folding, tokenizing, stopword dan stemming. Tahap selanjutnya yaitu tahap pembobotan term. Pembobotan atau term weighting merupakan proses mendapatkan nilai term yang berhasil diekstrak dari proses sebelumnya yaitu proses preprocessing. Algoritma yang digunakan untuk tahap pembobotan pada penelitian ini adalah algoritma TFIDF. Setelah didapatkan nilai dari bobot term, kemudian dicari nilai jarak antar dokumen menggunakan algoritma cosine similarity. Langkah berikutnya adalah melakukan pengurutan data dalam data training berdasarkan hasil perhitungan nilai jarak. Selanjutnya, dari hasil pengurutan tersebut diambil sejumlah K data yang memiliki nilai kedekatan. Tujuan dari penelitian ini adalah sistem mampu mengimplementasikan algoritma KNN pada dokumen yang memiliki similarity yang tinggi. Pada penelitian ini dilakukan 3 pengujian dengan tiga variasi dataset yang berbeda dengan empat nilai K. Hasil akurasi yang terbaik didapatkan ketika sistem menggunakan nilai K=9 yang menunjukkan nilai precision sebesar 100%, recall sebesar 100% dan nilai f-measure sebesar 100%.
Kata Kunci: klasifikasi, algoritma K-Nearest Neighbor, TFIDF, cosine similarity, confusion matrix.
References
Ayu Puspitasari, A., Santoso, E., & Indriati. (2018). Klasifikasi Dokumen Tumbuhan Obat Menggunakan Metode Improved k-Nearest Neighbor. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 2, 486–492.
Palinoan, V. W. (2014). Sistem Klasifikasi Dokumen Bahasa Jawa Dengan Metode K Nearest Neighbor.
Rani, N. L. R. M. (2013). Persepsi Jurnalis dan Praktisi Humas terhadap Nilai Berita. Jurnal Ilmu Komunikasi, 10(1).
Rivki, M., & Bachtiar, A. M. (2017). IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOR DALAM PENGKLASIFIKASIAN FOLLOWER TWITTER YANG MENGGUNAKAN BAHASA INDONESIA. Jurnal Sistem Informasi, 13(1), 31. https://doi.org/10.21609/jsi.v13i1.500.
Setiawan, A., Kurniawan, E., & Handiwidjojo, W. (2013). IMPLEMENTASI STOP WORD REMOVAL UNTUK PEMBANGUNAN APPLIKASI ALKITAB BERBASIS WINDOWS 8, 06(02), 11.
Windu, G., & Purnomo. (2017). Akurasi Text Mining Menggunakan Algoritma K-Nearest Neighbour pada Data Content Berita SMS. Format, 6(1), 1–13.