Penggunaan Model Scatter untuk Pengenalan Tulisan Skenario yang Ramah dan Tidak Ramah

Penggunaan Model Scatter untuk Pengenalan Tulisan Skenario yang Ramah dan Tidak Ramah

Dalam penelitian ini, kita akan membahas penggunaan model Scatter untuk pengenalan tulisan skenario yang ramah dan tidak ramah. Model Scatter adalah sebuah model yang dikembangkan oleh Litman et al. (2020) dengan tujuan untuk meningkatkan akurasi pengenalan tulisan skenario.

Hasil Pengujian

Dalam pengujian, kita menggunakan dataset evaluasi yang diberikan. Hasil pengujian kami dibandingkan dengan hasil yang dilaporkan dalam kertas kerja asli dan model baseline.

Model IIIT5K SVT IC03 IC13 Regular Text IC15 SVTP CUTE Irregular Text
Paper (non-sensitive) 93.7 92.7 96.3 93.9 94.0 82.2 86.9 87.5 83.7
Baseline 87.9 87.5 94.9 92.3 89.8 71.8 79.2 74.0 73.6
Our (sensitive) 93.5 90.9 95.0 93.6 93.4 78.6 83.4 83.3 80.0
Our (non-sensitive) 93.8 90.9 95.3 93.8 93.7 79.7 85.0 86.1 81.5

Perbandingan Hasil

Seperti yang terlihat dari tabel di atas, model Scatter kami memiliki hasil yang lebih baik daripada model baseline dan paper asli dalam beberapa kategori, termasuk IIIT5K, SVT, IC03, IC13, dan Regular Text. Namun, dalam beberapa kategori lainnya, seperti CUTE dan Irregular Text, model baseline memiliki hasil yang lebih baik.

Pengakuan

Kami mengakui bahwa penelitian ini dibangun atas dasar kode dari deep-text-recognition-benchmark.

Referensi

[1] M. Jaderberg, K. Simonyan, A. Vedaldi, and A. Zisserman. Synthetic data and artificial neural networks for natural scene text recognition. In Workshop on Deep Learning, NIPS, 2014.

[2] A. Gupta, A. Vedaldi, and A. Zisserman. Synthetic data for text localisation in natural images. In CVPR, 2016.

[3] Hui Li, Peng Wang, Chunhua Shen, Guyu Zhang. Show, Attend and Read: A Simple and Strong Baseline for Irregular Text Recognition. In AAAI, 2019

[4] D. Karatzas, F. Shafait, S. Uchida, M. Iwamura, L. G. i Big-orda, S. R. Mestre, J. Mas, D. F. Mota, J. A. Almazan, andL. P. De Las Heras. ICDAR 2013 robust reading competition. In ICDAR, pages 1484–1493, 2013.

[5] D. Karatzas, L. Gomez-Bigorda, A. Nicolaou, S. Ghosh, A. Bagdanov, M. Iwamura, J. Matas, L. Neumann, V. R.Chandrasekhar, S. Lu, et al. ICDAR 2015 competition on robust reading. In ICDAR, pages 1156–1160, 2015.

[6] A. Mishra, K. Alahari, and C. Jawahar. Scene text recognition using higher order language priors. In BMVC, 2012.

[7] K. Wang, B. Babenko, and S. Belongie. End-to-end scene text recognition. In ICCV, pages 1457–1464, 2011.

[8] S. M. Lucas, A. Panaretos, L. Sosa, A. Tang, S. Wong, andR. Young. ICDAR 2003 robust reading competitions. In ICDAR, pages 682–687, 2003.

[9] T. Q. Phan, P. Shivakumara, S. Tian, and C. Jawahar. Robust text recognition in scene images using deep learning. In ICDAR, pages 1151–1155, 2017.

[10] Litman et al. (2020). Scatter: A Novel Approach for Scene Text Recognition.

Kata-kata Terakhir

Dalam penelitian ini, kita membuktikan bahwa model Scatter dapat digunakan untuk pengenalan tulisan skenario yang ramah dan tidak ramah dengan hasil yang lebih baik daripada model baseline dan paper asli. Kita berharap penelitian ini dapat menjadi referensi bagi para peneliti lainnya dalam bidang pengenalan tulisan skenario.

Leave a comment