PENERAPAN METODE TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY DAN K-NEAREST NEIGHBOR UNTUK ANALISIS ULASAN HOTEL DI SITUS TRIPADVISOR
Abstract
Penelitian ini latarbelakangi oleh masalah evaluasi produk dan layanan menggunakan metode tradisional seperti wawancara, survei, dan kuisioner, yang sering menghasilkan analisis yang tidak konsisten dan tidak akurat. Penelitian ini bertujuan untuk menerapkan algoritma Term Frequency-Inverse Document Frequency (TF-IDF) dan K-Nearest Neighbor untuk meningkatkan akurasi evaluasi sistem. Salah satu pendekatan untuk mengatasi masalah tersebut adalah dengan mengembangkan sistem untuk menganalisis ulasan pelanggan hotel dari situs TripAdvisor, yang dikategorikan sebagai positif, negatif, dan netral menggunakan teknik text mining. Algoritma K-Nearest Neighbor dipilih karena kemampuannya dalam komputasi yang efisien, ketahanan terhadap data yang besar, dan kompleksitas algoritma yang relatif rendah. Hasil penelitian menunjukkan bahwa sistem ini mampu mengklasifikasikan ulasan hotel dengan tingkat akurasi yang optimal, mencapai 76% untuk data pelatihan dengan K=31, dan meningkatkan akurasi hingga 84% setelah menerapkan metode random over-sampling untuk mengatasi data tidak seimbang.