Skripsi
NAMED ENTITY RECOGNITION (NER) PADA TEKS BERBAHASA INDONESIA DENGAN FINE-TUNING INDOBERT
Pengolahan dokumen tekstual sering kali membutuhkan identifikasi informasi penting seperti nama orang, tempat, dan lembaga, namun proses manual memakan waktu dan kurang efisien. Named Entity Recognition (NER) menjadi solusi otomatis untuk tugas ini, tetapi penerapannya dalam bahasa Indonesia menghadapi tantangan seperti variasi dialek dan struktur linguistik yang kompleks. Penelitian ini menggunakan metodologi fine-tuning pada model 'indobenchmark/indobert-base-p2' dengan dataset NER-Grit dari repositori GitHub untuk menghadapi tantangan struktur linguistik bahasa Indonesia yang beragam. Model diuji menggunakan berbagai konfigurasi parameter untuk memperoleh hasil optimal. Evaluasi menunjukkan bahwa konfigurasi terbaik dengan learning rate 5e-6, batch size 8, dan 10 epoch menghasilkan nilai f1-score 0,7420 (atau 74,20%) dan nilai loss 0,3673. Penelitian ini berkontribusi pada pengembangan sistem NER yang lebih adaptif terhadap variasi domain dan dialek dalam bahasa Indonesia, sehingga mendukung pengolahan informasi secara lebih cepat dan akurat untuk berbagai kebutuhan analitik dan aplikasi praktis. Kata Kunci: Named Entity Recognition, IndoBERT, Fine-tuning, Pemrosesan Bahasa Alami
| Inventory Code | Barcode | Call Number | Location | Status |
|---|---|---|---|---|
| 2407006939 | T161994 | T1619942025 | Central Library (REFERENCE) | Available but not for loan - Not for Loan |
No other version available