Search by :

ALL Author Subject ISBN/ISSN Advanced Search

Last search:

Image of KERANGKA KERJA TOKENISASI BERDASARKAN STRUKTUR KALIMAT BAHASA INDONESIA

Skripsi

KERANGKA KERJA TOKENISASI BERDASARKAN STRUKTUR KALIMAT BAHASA INDONESIA

Petrus, Johannes - Personal Name;

Penilaian

0,0

dari 5

Penelitian ini bertujuan untuk membangun sebuah kerangka kerja tokenisasi berdasarkan struktur kalimat bahasa Indonesia. Tokenisasi akan menghasilkan token baik berupa kata tunggal maupun multi kata, yang berbeda dengan konsep tokenisasi umum yang hanya menghasilkan token kata tunggal saja. Untuk menghasilkan token seperti diatas, Penelitian Disertasi ini menggunakan metode ekstraksi struktur kalimat yang menghasilkan fungsi-fungsi kalimat sebagai sebuah token. Metode ini merupakan hal yang baru karena sejauh yang penulis ketahui proses ekspresi multi kata (multi word expression) menggunakan metode statistik, linguistik, kamus dan jaringan neural. Hasil ekstraksi struktur kalimat berupa unsur fungsi kalimat seperti Subjek, Predikat, Objek, Pelengkap dan Keterangan. Sebuah kalimat minimal terdiri dari Subjek dan Predikat. Masing-masing fungsi kalimat dapat berupa sebuah kata atau gabungan beberapa kata. Gabungan beberapa kata tersebut dapat menjadi token multi kata Penelitian ini menerapkan pembelajaran mesin untuk melakukan ekstraksi struktur kalimat, dengan terlebih dahulu membangun sebuah dataset struktur kalimat bahasa Indonesia. Ekstraksi struktur kalimat dalam penelitian ini hanya dilakukan terhadap kalimat tunggal dan berjenis kalimat aktif. Dalam percobaan mengekstrak struktur dari 100 kalimat dan membandingkan token yang diprediksi dengan token yang seharusnya, diperoleh nilai Precision sebesar 0,92 dan nilai Recall sebesar 0,86. Kata Kunci : Kerangka Kerja, Multi Kata, Segmentasi Kalimat, Struktur Kalimat, Token.

Availability

Inventory Code	Barcode	Call Number	Location	Status
2307005254	T126809	T1268092023	Central Library (Referens)	Available but not for loan - Not for Loan

Detail Information

Series Title: -
Call Number: T1268092023
Publisher: Indralaya : Fakultas Teknik, Prodi Doktor Ilmu Teknik, Universitas Sriwijaya., 2023
Collation: xiii, 137 hlm.; Ilus.; 29 cm
Language: Indonesia
ISBN/ISSN: -
Classification: 620.001 07
Content Type: -
Media Type: -
Carrier Type: -
Edition: -
Subject(s): Fakultas Teknik
Teori Ilmu Teknik
Specific Detail Info: -
Statement of Responsibility: PITRIA

Other version/related

No other version available

File Attachment

KERANGKA KERJA TOKENISASI BERDASARKAN STRUKTUR KALIMAT BAHASA INDONESIA

Comments

You must be logged in to post a comment