Text
Penerapan morphological analyzer dan boyer-moore untuk perbaikan ejaan kata pada dokumen bahasa Indonesia
Pada saat penulisan dokumen sering ditemukannya kesalahan ejaan kata sehingga
informasi tidak tersampaikan dengan baik. Hal ini perlu dilakukannya perbaikan
ejaan kata. Perbaikan ejaan kata terdiri dari dua tahapan utama, pengecekan dan
perbaikan. Pada penelitian ini, pengecekan ejaan kata dilakukan dengan
menggunakan Morphological Analyzer dan perbaikan ejaan kata dilakukan dengan
menggunakan N-gram dan Boyer – Moore. N-gram dan Boyer Moore memperbaiki
kesalahan ejaan kata dengan mencacah kata salah ejaan menjadi kumpulan
substring N-gram (Uni-gram dan Bi-gram) dan mencari kandidat kata berdasarkan
substring terbanyak. Kandidat kata diurutkan dengan mencari probabilitas
kemiripan antara kata salah ejaan dan kandidat kata menggunakan Jaro – Winkler
Similarity dan LCS (Longest Common Subsequence). Uji coba sistem perbaikan
ejaan kata menunjukkan keberhasilan sebesar 96.04% dari 1364 kata yang diujikan
dengan akurasi pengecekan sebesar 98.53% dan akurasi perbaikan sebesar 59.09%.
No copy data
No other version available