多语言语境下的情感分析任务荣获第一名

2022年06月,北理工NLPIR团队在上海-香港跨学科社交媒体分析联合评测中,表现优异,荣获多语言语境下的情感分析第一名。该系统由王彦浩同学主要开发,张华平老师主要指导。

本次社会媒体分析联合评测由香港理工大学香港中文大学复旦大学同济大学共同承办,由香港理工大学SMART研究组和复旦大学DISC实验室提供标注数据集,通过收集和标注社交媒体上丰富的数据,来探索自然语言处理技术在谣言检测(rumorverification)、投票生成(pollquestion generation)、情绪识别(emotion analysis)、用户画像(user profile modeling)以及多语言语境下的情感分析(sentiment analysis for code-switched text)5项任务上的应用。

多语言语境下的情感分析(Sentiment Analysis for Code-Switched Text)在社交媒体中,由于网络用语的高度个性化和迅速传播的特点,文本分析变得越来越重要。情感分析作为社交媒体文本分析的一个典型应用,已经在多种多样的自然语言处理(NLP)领域中,从各种语言学角度(如语义,句法和认知属性)展开研究。由于全球化的发展,在某些地区,例如中国大陆和香港,社交媒体文本通常伴随着大量的的语言转换,例如“今天我很happy!”。该任务旨在从伴随着语言转换的用户评论中识别用户的情绪。在此数据集中,评论主要语言为粤语。其他语言,包括英语,法语,日语等的使用,给情绪识别带来了新的挑战。

最终我们NLPIR团队基于sentiment-bert预训练模型针对比赛数据进行post-pretrain,并辅以对抗训练、Focal loss 和 batch内collate_fn等操作,在评测中取得了不错的效果。

You May Also Like

About the Author: caijiahao

发表回复