PENGENALAN TEKS BAHASA INDONESIA PADA CITRA TULISAN TANGAN BERBASIS TRANSFORMER

https://doi.org/10.22146/ijeis.86926

Dianita Alfi Rahmawati(1*), Ika Candradewi(2)

(1) Gadjah Mada University
(2) Gadjah Mada University
(*) Corresponding Author

Abstract


Digitalisasi dokumen dapat dipercepat berkat kemajuan teknologi. Banyak upaya telah dilakukan untuk mengenali teks dari foto. Banyak arsitektur mampu mengenali teks, khususnya citra tulisan tangan salah satunya adalah transformer. Pada penelitian sebelumnya masih banyak yang menggunakan dataset citra dengan aksara tegak sehingga kurang variatif. Untuk meningkatkan keahlian pemodelan pembelajaran, proyek ini berfokus pada pengimplementasian dan pengembangan sistem pada Transformers dengan pengujian dataset yang lebih bervariasi.

Dataset yang digunakan terdiri dari foto dengan tulisan Indonesia. setelah langkah pra-pemrosesan kemudian akan diubah menjadi token dengan label kelas dan koordinat kotak pembatas untuk anotasi gambar. Dataset akan dilatih menggunakan arsitektur transformer. Encoder-decoder merupakan dasar dari arsitektur Transformer ini. Pengujian data dilakukan setelah model dilatih menggunakan mean Average Precision (mAP).

Sistem yang dibuat mampu mengenali dan mengklasifikasikan objek secara akurat dari data gambar tulisan tangan, termasuk objek yang mewakili kata-kata bahasa Indonesia. Hyperparameter yang paling optimal didapatkan batch dan jumlah epoch masing-masing 32 dan 40. Dengan menggunakan parameter terbaik, evaluasi model menghasilkan data dari sampel latih dan uji dengan masing-masing nilai mAP 0,97 dan 0,95.


Keywords


Transformer; Image Recognition; Tulisan Tangan

Full Text:

PDF


References

Chen T, Saxena S, Li L et al., "Pix2seq: A Language Modeling Framework for Object Detection", ArXiv, ID: 2109.10852, 2021. [Online]. Available: http://arxiv.org/abs/2109.10852. [Accessed: Feb-2023]

Ly V, Doan T, Ly N, "Transformer-based model for Vietnamese Handwritten Word Image Recognition", Proceedings - 2020 7th NAFOSTED Conference on Information and Computer Science, NICS 2020 page 163-168, 2020 doi: 10.1109/NICS51282.2020.9335877 Scopus: 2-s2.0-85101122800.

Vaswani A, Shazeer N, Parmar N et al., "Attention Is All You Need", ArXiv, ID: 1706.03762, 2017. [Online]. Available: http://arxiv.org/abs/1706.03762. [Accessed: Feb-2023]

Touvron H, Cord M, Jégou H, "DeiT III: Revenge of the ViT", ArXiv, ID: 2204.07118 2022. [Online]. Available: https://arxiv.org/pdf/2204.07118 [Accessed: Jun 2023]

Touvron H, Cord M, Douze M et al., "Training Data-Efficient Image Transformers & Distillation Through Attention", ArXiv, ID: 2012.12877, 2020. [Online] Available: http://arxiv.org/abs/2012.12877 [Accessed: Jun 2023]

Dosovitskiy A, Beyer L, Kolesnikov A et al., "An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale", ArXiv, ID: 2010.11929, 2020. [Online] Available: http://arxiv.org/abs/2010.11929 [Accessed: Nov 2022]

Bi J, Zhu Z, Meng Q, "Transformer in Computer Vision", 2021 IEEE International Conference on Computer Science, Electronic Information Engineering and Intelligent Control Technology, CEI 2021 page 178-188, 2021. doi: 10.1109/CEI52496.2021.9574462 Scopus: 2-s2.0-85118925905

Bhunia A, Khan S, Cholakkal H et al., "Handwriting Transformers", ArXiv, ID: 2104.03964, 2021. [Online] Available: http://arxiv.org/abs/2104.03964 [Accessed: Nov 2022]

Pu Y, Apel D, Szmigiel A et al. "Image Recognition of Coal and Coal Gangue Using a Convolutional Neural Network and Transfer Learning", Energies, Vol. 12(9), 2019. doi: 10.3390/en12091735 Scopus: 2-s2.0-85065980182

Shaikh M, Duan T, Chauhan M et al., "Attention based Writer Independent Verification", Proceedings of International Conference on Frontiers in Handwriting Recognition, ICFHR, page 373-379, 2020. doi: 10.1109/ICFHR2020.2020.00074 Scopus: 2-s2.0-85097792375

Bayat O, Aljawarneh S, Carlak H et al. "Understanding of a Convolutional Neural Network", Book: Proceedings of 2017 International Conference on Engineering & Technology (ICET'2017) : Akdeniz University, Antalya, Turkey, 21-23 August, 2017. ISBN: 9781538619490



DOI: https://doi.org/10.22146/ijeis.86926

Article Metrics

Abstract views : 544 | views : 314

Refbacks

  • There are currently no refbacks.




Copyright (c) 2024 IJEIS (Indonesian Journal of Electronics and Instrumentation Systems)

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.



Copyright of :
IJEIS (Indonesian Journal of Electronics and Instrumentations Systems)
ISSN 2088-3714 (print); ISSN 2460-7681 (online)
is a scientific journal the results of Electronics
and Instrumentations Systems
A publication of IndoCEISS.
Gedung S1 Ruang 416 FMIPA UGM, Sekip Utara, Yogyakarta 55281
Fax: +62274 555133
email:ijeis.mipa@ugm.ac.id | http://jurnal.ugm.ac.id/ijeis



View My Stats1
View My Stats2