Skripsi Statistik
Pemodelan pada judul berita online Detikcom menggunakan Latent Dirichlet Allocation
Detikcom merupakan portal berita online yang sangat populer saat ini. Berita pada ortal tersebut terus bertambah seiring berjalannya waktu sehingga menyebabkan makin menumpuknya data berita yang ada. Oleh karena itu perlu adanya pemanfaatan data yang berjumlah besar tersebut. Salah satu cara yang dapat digunakan adalah dengan melakukan ekstraksi topik dari data teks berita melalui pemodelan topik menggunakan metode Latent Dirichlet Allocation. Metode ini merupakan metode pemodelan topik yang sangat populer karena dapat melakukan analisis pada dokumen yang berukuran sangat besar. Penelitian ini bertujuan untuk menemukan pola tertentu pada sebuah dokumen dengan menghasilkan beberapa macam topik yang berbeda, sehingga tidak secara spesifik mengelompokkan dokumen ke dalam sebuah topik tertentu. Dari penelitian ini diperoleh jumlah topik yang terbentuk sebanyak 3 dengan coherence score sebesar 0,7586. Kesimpulan dari setiap topiknya yaitu topik ke-1 membahas konflik dan krisis suatu negara, topik ke-2 membahas isu yang berkaitan dengan kemanusiaan, dan topik ke-3 membahas isu korupsi yang dilakukan oleh pejabat negara.
Kata kunci: Detkcom, Latent Dirichlet Allocation (LDA), Pemodelan Topik
Tidak tersedia versi lain