Text
Klasifikasi halaman web menggunakan cosine similarity
Perkembangan internet yang pesat dalam penyampaian informasi
menyebabkan halaman web menjadi sangat banyak, sehingga akan sulit
diklasifikasikan secara manual. Pada penelitian ini dikembangkan sebuah sistem
pengklasifikasian halaman web berdasarkan konten utama yaitu artikel/berita.
Dipilihya metode Cosine Similarity karena tidak terpengaruh pada panjang
pendeknya suatu dokumen. Karena yang diperhitungkan hanya nilai term dari
masing-masing dokumen. Metode Cosine Similarity dapat mengukur kesamaan antara
dua vektor kata kunci dan dokumen. Hasil perhitungan Cosine Similarity dari 40
dokumen uji menghasilkan tingkat akurasi sebesar 97,5% dengan jumlah yang dapat
diklasifikasi dengan benar adalah 39 dokumen uji
No copy data
No other version available