VisPhone: Chinese Named Entity Recognition Model Enhanced by Visual and Phonetic Features
作者:张宝华;蔡佳豪;张华平;商建云
论文下载地址:https://www.sciencedirect.com/science/article/pii/S0306457323000511
Information Processing and Management, Volume 60, Issue 3,2023,103314, ISSN 0306-4573,https://doi.org/10.1016/j.ipm.2023.103314. (IF: 7.466, SCI CAS Q1)
很多中文命名实体识别模型仅关注词汇和部首信息,忽略了中文实体的发音规则。在本文中,我们提出了VisPhone,它将中文字符的音韵特征与词汇和视觉特征一起合并到cross transformer中。我们介绍了中文实体的发音规则,并探索最合适的编码方法。VisPhone使用两个相同的cross transformer将输入字符的视觉和音韵特征与文本嵌入相融合。使用选择性融合模块获得最终特征。我们在四个著名的中文命名实体识别基准数据集上进行了实验:OntoNotes4.0、MSRA、Resume和Weibo,取得了较好的效果。同时消融实验也证明了VisPhone的有效性。