Learning Sub-Character level representation for Korean Named Entity Recognition

Yejin Kim; Yekyung Kim

doi:10.32473/flairs.v34i1.128509

Learning Sub-Character level representation for Korean Named Entity Recognition

作者

Yejin Kim LG Electronics
Yekyung Kim

##plugins.pubIds.doi.readerDisplayName##:

https://doi.org/10.32473/flairs.v34i1.128509

摘要

Most of the previous studies on the Korean Named Entity Recognition (NER) topic focused on utilizing morphological-level information because the language is rich in character diversity. This paper illustrates an improved unigram-level Korean NER model with sub-character level representation, jamo, which can represent a unique linguistic structure of Korean and its syntactic properties and morphological variations. The experimental result shows that exploiting sub-character gives us a boost of + (avg) 2 F1, also, our proposed C-GRAM model outperformed about 3 F1 comparing with the baseline.

##submission.downloads##

PDF (English)

已出版

2021-04-18

##submission.howToCite##

Kim, Y., & Kim, Y. (2021). Learning Sub-Character level representation for Korean Named Entity Recognition. The International FLAIRS Conference Proceedings, 34. https://doi.org/10.32473/flairs.v34i1.128509

##submission.howToCite.downloadCitation##

期

卷 34 (2021): Proceedings of FLAIRS-34

栏目

Special Track: Applied Natural Language Processing

Learning Sub-Character level representation for Korean Named Entity Recognition

作者

##plugins.pubIds.doi.readerDisplayName##:

摘要

##submission.downloads##

已出版

##submission.howToCite##

期

栏目

##plugins.block.developedBy.blockTitle##

##plugins.block.makeSubmission.linkLabel##

语言