Text
KLASIFIKASI PDF MALWARE PADA LAYANAN AGREGATOR NASIONAL (GARUDA) KEMDIKBUD DIKTI DENGAN METODE NAIVE BAYES CLASSIFIER
Garba Rujukan Digital (GARUDA) merupakan salah satu e-library akademisi Indonesia yang memakai PDF sebagai ekstensi file. Dataset yang digunakan dalam penelitian ini berasal dari portal GARUDA dengan data sebanyak 10000 yang terdiri dari 9800 benign, 196 malicious html, dan enam malicious pdf. Dataset dianalisis menggunakan VirusTotal, PDF-parser dan PDFid. Proses klasifikasi dilakukan sebanyak tiga tahap menggunakan metode Gaussian Naive Bayes, yaitu: (i) klasifikasi pada dataset imbalance yang menghasilkan nilai akurasi sebesar 0,2280, (ii) klasifikasi dengan penambahan SMOTE untuk mengatasi dataset imbalance yang meghasilkan nilai akurasi sebesar 0,7361, (iii) klasifikasi dengan gabungan SMOTE dan Near Miss untuk mengatasi dataset imbalance yang menghasilkan nilai akurasi sebesar 0,9643, presisi 0,9640, recall 0,9675 dan f1score 0,9639. Kata Kunci : Klasifikasi, PDF Malware, VirusTotal, PDFid, Gaussian Naive Bayes, SMOTE, Near Miss.
Inventory Code | Barcode | Call Number | Location | Status |
---|---|---|---|---|
2307003060 | T125111 | T1251112023 | Central Library (Referens) | Available but not for loan - Not for Loan |
No other version available