Text
Pengoreksian Ejaan Kata Berdasarkan Kemiripan Pelafalan (Phonetic String Matching) Soundex Dalam Kata Bahasa Indonesia
Kesalahan penulisaan ejaan terjadi disebabkan karena ketidaktahuan penulis akan ejaan
kata yang ditulis, dan penyebab kedua adalah karena kesalahan teknis. Oleh karena itu,
dibutuhkan sebuah program yang dapat mendeteksi kesalahan dalam penulisan bahasa.
Penelitian ini terdiri dari tiga proses, yaitu Pre-processing, algortima Soundex, dan Dice
Similiarity. Pada Pre-processing dilakukan pengolahan dokumen seperti, tokenizing, dan case
folding. Pada algoritma Soundex dilakukan proses pengubahan dari kata ke kode. Uji coba
perangkat lunak dilakukan dengan melakukan pengujian terhadap 4 dokumen yang mewakili 4
jenis kata typo. Penelitian ini menghasilkan bahwa ketepatan program dalam menerjemahkan
kode kata typo ke kode kata yang benar sebesar 96% dan meghasilkan kata keluaran yang terpat
sebesar 69%.
Kata Kunci : Pre-processing, soundex, dice similiarity, tokenizing, dan case folding
No copy data
No other version available