no code implementations • CCL 2021 • Long Chen, Junjun Guo, Yafei Zhang, Chengxiang Gao, Zhengtao Yu
“当前基于深度学习的事件检测模型都依赖足够数量的标注数据, 而标注数据的稀缺及事件类型歧义为越南语事件检测带来了极大的挑战。根据“表达相同观点但语言不同的句子通常有相同或相似的语义成分”这一多语言一致性特征, 本文提出了一种基于中文信息与越南语句法指导的越南语事件检测框架。首先通过共享编码器策略和交叉注意力网络将中文信息融入到越南语中, 然后使用图卷积网络融入越南语依存句法信息, 最后在中文事件类型指导下实现越南语事件检测。实验结果表明, 在中文信息和越南语句法的指导下越南语事件检测取得了较好的效果。”
no code implementations • CCL 2022 • Junjie Ye, Junjun Guo, Kaiwen Tan, Yan Xiang, Zhengtao Yu
“多模态神经机器翻译旨在利用视觉信息来提高文本翻译质量。传统多模态机器翻译将图像的全局语义信息融入到翻译模型, 而忽略了图像的细粒度信息对翻译质量的影响。对此, 该文提出一种基于图文细粒度对齐语义引导的多模态神经机器翻译方法, 该方法首先跨模态交互图文信息, 以提取图文细粒度对齐语义信息, 然后以图文细粒度对齐语义信息为枢纽, 采用门控机制将多模态细粒度信息对齐到文本信息上, 实现图文多模态特征融合。在多模态机器翻译基准数据集Multi30K 英语→德语、英语→法语以及英语→捷克语翻译任务上的实验结果表明, 论文提出方法的有效性, 并且优于大多数最先进的多模态机器翻译方法。”
no code implementations • COLING 2022 • Yan Li, Chenliang Li, Junjun Guo
Asymmetric text matching has becoming increasingly indispensable for many downstream tasks (e. g., IR and NLP).
no code implementations • CCL 2021 • Enchang Zhu, Zhengtao Yu, Chengxiang Gao, Yuxin Huang, Junjun Guo
“新闻事件要素抽取旨在抽取新闻文本中描述主题事件的事件要素, 如时间、地点、人物和组织机构名等。传统的事件要素抽取方法在资源稀缺型语言上性能欠佳, 且对长文本语义建模困难。对此, 本文提出了基于阅读理解的汉越跨语言新闻事件要素抽取方法。该方法首先利用新闻长文本关键句检索模块过滤含噪声的句子。然后利用跨语言阅读理解模型将富资源语言知识迁移到越南语, 提高越南语新闻事件要素抽取的性能。在自建的汉越双语新闻事件要素抽取数据集上的实验证明了本文方法的有效性。”
no code implementations • COLING 2022 • Junjie Ye, Junjun Guo, Yan Xiang, Kaiwen Tan, Zhengtao Yu
This paper proposes a noise-robust multi-modal interactive fusion approach with cross-modal relation-aware mask mechanism for MNMT.