Skripsi Statistik
Pemodelan Topik Pada Media Berita Tribunnews Menggunakan Latent Semantic Analysis
Kebutuhan akan informasi menjadi bertambah seiring dengan cepatnya
perkembangan teknologi informasi seperti saat ini, yang berakibat pada
penumpukan data berita. Tribunnews.com adalah salah satu media berita yang
cukup populer. Topik modelling adalah salah satu cara untuk mengelola data berita
dengan melakukan ekstraksi topik yang salah satu metodenya adalah Latent
Semantic Analysis (LSA). LSA merupakan metode yang dapat mengekstraksi dan
menyimpulkan suatu hubungan kontekstual arti kata pada bagian teks yang
dibutuhkan. Dalam tahapan analisis digunakan Term Frequency Inverse Document
Matrix (TF-IDF) untuk menghitung bobot serta Bigram dan Trigram untuk
meminimalisir pemenggalan kata yang berpotensi merubah makna kata. Hasil yang
diperoleh pada penelitian ini yaitu Wordcloud, di dapatkan topik paling sering
muncul, Ada 5 yaitu Masyarakat, Timnas, Tim, Pertandingan, Negara, dan
Pemodelan Topik LSA diperoleh 2 Topik dengan coherence score terbaik yaitu
sebesar 0,8229, dimana pada Topik ke-1 membahas tentang Topik Olahraga dan
Topik ke-2 membahas tentang Tokoh Politik dan Partai politik.
Kata Kunci : Latent Semantic Analysis, Tribunnews, Topic Modelling, BigramTrigram, Wordcloud.
Tidak tersedia versi lain