This item is published by Universitas Islam Negeri Sunan Ampel Surabaya
Fanani, Muhammad Jawahirul (2025) Peringkas otomatis berita bahasa Indonesia pada domain Pemilu menggunakan BART. Undergraduate thesis, UIN Sunan Ampel Surabaya.
This is the latest version of this item.
|
Text
Muhammad Jawahirul Fanani_09020621036 OK.pdf Download (2MB) |
|
|
Text
Muhammad Jawahirul Fanani_09020621036 Full.pdf Restricted to Repository staff only until 13 December 2028. Download (2MB) |
Abstract
Tingginya volume berita online tentang pemilu selama masa pemilu di Indonesia, yang didorong oleh kemajuan teknologi, dapat menyulitkan public dalam memahami informasi esensial terkait pemilu. Penelitian ini mengembangkan dan mengevaluasi model BART (bart-base) untuk meringkas berita pemilu berbahasa Indonesia, dengan fokus utama pada optimisasi tokenizer. Beberapa custom tokenizer berbasis Byte-Pair Encoding dikembangkan menggunakan korpus bahasa Indonesia. Selanjutnya, model BART di-fine-tuning dan dibandingkan dengan konfigurasi yang menggunakan tokenizer original sebagai baseline. Hasil menunjukkan bahwa semua model dengan custom tokenizer secara signifikan mengungguli baseline. Model 'bart-base-mix' dan 'bart-base-detiknews-pemilu' mendapatkan evaluasi terbaik, dengan skor tertinggi pada ROUGE-1 mencapai 25,40, ROUGE-2 mencapai 12,95, dan BERTScore mencapai 71,39. Tokenizer 'mix-50k' terbukti paling efisien karena menghasilkan total token paling sedikit dan mencatatkan waktu pelatihan tercepat. Analisis stabilitas menunjukkan bahwa meskipun baseline memiliki standar deviasi terendah, model custom mampu mencapai stabilitas relatif (Koefisien Variasi) yang kompetitif, bahkan mengungguli baseline pada metrik ROUGE dengan nilai CV terendah mencapai 4,59% pada ROUGE-1 (bart-base-detiknews-pemilu) dan 8,07% pada ROUGE-2 (bart-base-mix). Pada metrik BERTScore bart-base-baseline memiliki nilai CV terendah yakni sebesar 0,34%.
Statistic
Downloads from over the past year. Other digital versions may also be available to download e.g. from the publisher's website.
| Item Type: | Thesis (Undergraduate) | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Creators: |
|
||||||||||||
| Contributors: |
|
||||||||||||
| Subjects: | Tehnik Informatika Teknologi > Teknologi Informasi Informasi |
||||||||||||
| Keywords: | peringkas otomatis; transformer; BART; ROUGE; BERTScore | ||||||||||||
| Divisions: | Fakultas Sains dan Teknologi > Studi Sistem Informasi | ||||||||||||
| Depositing User: | Muhammad Jawahirul Fanani | ||||||||||||
| Date Deposited: | 13 Dec 2025 08:08 | ||||||||||||
| Last Modified: | 13 Dec 2025 08:08 | ||||||||||||
| URI: | http://digilib.uinsa.ac.id/id/eprint/84707 |
Available Versions of this Item
-
Peringkas otomatis berita bahasa Indonesia pada domain Pemilu menggunakan BART. (deposited UNSPECIFIED)
- Peringkas otomatis berita bahasa Indonesia pada domain Pemilu menggunakan BART. (deposited 13 Dec 2025 08:08) [Currently Displayed]
Actions (login required)
![]() |
View Item |
