计算机科学与技术学院欢迎你 |

新闻通知

  • 重要新闻
  • 综合新闻
  • 学术讲座
  • 学生工作
  • 通知公告

我院八篇论文被自然语言处理领域的国际顶级学术会议EMNLP 2021录用

来源: 作者:发布时间:2021-09-17阅读:

【计算机科学与技术学院 宣】(刘炜豪 周彬/文,刘欣 周彬/图)近日,我院徐睿峰、陈清财、卢光明三位教授指导的八篇学生论文获自然语言处理国际顶级学术会议The 2021 Conference on Empirical Methods in Natural Language Processing (EMNLP 2021) 录用,其中5篇录用到主会,3篇录用到Findings of EMNLP

EMNLPACL SIGDAT(语言学数据特殊兴趣小组)主办,是自然语言处理领域的国际顶级学术会议。EMNLP 2021将于2021117日至11日以在线会议和线下会议的混合形式举办。录用论文及简介如下。


题目:Argument Pair Extraction with Mutual Guidance and Inter-sentence Relation Graph

作者:鲍建竹,梁斌,孙婧伊,张义策,杨敏,徐睿峰

录用类别:主会

本文通过一个互指导的框架来解决论点对抽取任务。该框架可以利用一个段落中的论点信息来指导识别另一个段落中与之配对的论点。此外,提出了通过构建句子间关系图来有效地建模两个句子间的关系,从而有效增强论点对的抽取。实验结果显示,本文方法可以更好地表示论点的整体语义信息,从而明确地捕捉论点对之间的复杂关联。


题目:An Empirical Study on Multiple Information Sources for Zero-shot Fine-grained Entity Typing

作者:陈奕,蒋海云,刘乐茂,史树明,范创,杨敏,徐睿峰

录用类别:主会

本文引入三种辅助信息来提升模型在细粒度实体分类上的零样本学习能力,包括上下文一致性、类型层次结构以及类型的背景知识,并针对这些信息源设计了一种多源融合模型。在BBNWiki两个数据集上的结果显示,对比现有基线模型,MSFMacro-F1指标分别提升了11.42%22.84%。在此基础上,本文深入分析了不同信息源之间的互补性,以及它们在目标任务上表现出的特点、优势和不足,给未来工作提供了重要线索。


题目:Beta Distribution Guided Aspect-aware Graph for Aspect Category Sentiment Analysis with Affective Knowledge

作者:梁斌,苏航,殷熔磾,桂林,杨敏,赵琴,余晓琪,徐睿峰

录用类别:主会

本文提出了一种结合beta分布的图网络模型用于解决aspect category情感分类问题。由于aspect category通常不会显式出现在上下文中,因此本文提出基于beta分布的特性,在外部情感知识库中对aspect category的情感路径进行建模,从而获取每一个情感词语对相应aspect category的重要程度(权重)。基于此,将这些情感词和权重配对视作为一座桥梁,在aspect category不出现在句子中时也能构建相应的图结构。实验结果表示,我们提出的方法在6个常用数据集上都取得了最优性能。


题目:Leveraging Capsule Routing to Associate Knowledge with Medical Literature Hierarchically

作者:刘欣,陈清财,陈俊颖,周文秀,柳庭瑜,杨新兰,彭卫华

录用类别:主会

为缓解将知识融入到文本过程中可能带入的文本表示混淆和噪音问题,本文提出利用胶囊路由算法将知识与医学文献分级关联对知识与文本的关联程度进行区分。首先,从医学文献中提取两个按经验设计的文本片段,并将它们分别编码为片段表示。其次,胶囊路由算法应用于两个片段表示上,通过胶囊计算和动态路由,将每个表示处理成一个新的胶囊表示,并且将胶囊表示整合为信息增益用于判断知识与医学文献的关联程度。实验结果和分析表明,与主流方法相比,本文模型可以更准确地判断出知识与医学文献间的关联程度。


题目:Progressive Self-Training with Discriminator for Aspect Term Extraction

作者:王乾龙,温志渊,赵琴,杨敏,徐睿峰

录用类别:主会

本文研究旨在缓解aspect extraction中标注数据不足的问题。虽然self-training可能是解决这个问题的有效方法,但它在未标记数据上产生的伪标签会引起噪音。本文使用两种方法来减轻伪标签中的噪声。一是在curriculum learning的启发下,传统的self-training改进为progressive self-training。另一个是使用一个discriminator 来过滤嘈杂的伪标签。在四个Semeval 数据集上的实验结果表明,本文模型显着优于现有模型。


题目:Graph-based Event Structure Induction for Document-Level Causal Relation Identification

作者:范创,刘道兴,覃立波,党一学,张岳,徐睿峰

录用类别:Findings of EMNLP

本文提供了一个新的视角在事件级别研究因果关系。通过将事件建模为一个单元(包含多个事件实例),使得在没有任何额外约束的情况下,实例级别的预测结果不再有冲突。同时通过简单的启发式方法(例如,共现关系),构建出包含丰富信息的事件异构图,帮助模型进行事件级别的因果推理。实验结果表明,本文的方法在不同实验设置下均优于最先进的基线模型。


题目:Improving Empathetic Response Generation by Recognizing Emotion Cause in Conversations

作者:高俊, 刘宇翰, 邓浩霖, 王伟, 曹雨, 杜嘉晨, 徐睿峰

录用类别:Findings of EMNLP


从心理学的角度,人类往往因为某些具体的原因而产生某种情感,因此有效识别出情感原因能更有利于理解情感以及生成更具有同理心的回复。从这个角度出发,论文提出了一个新型的同理心对话框架:通过识别对话中的情感原因来提高同理心回复的生成。具体的,一个情感推理器用于识别对话历史中的情感原因和对应的情感,然后设计了硬/软门控注意力机制来将情感原因的信息有效融入回复生成中。实验结果表明,结合情感原因信息可以在情感识别和回复生成两方面有效提高模型的性能


题目:Bidirectional Hierarchical Attention Networks based on Document-level Context for Emotion Cause Extraction

作者:胡贵敏,卢光明,赵毅

录用类别:Findings of EMNLP


针对现有情感原因抽取工作很少关注文档级上下文信息对情感原因提取影响的问题,本文提出了一个与指定的候选原因子句相对应的双向层次注意网络,以结构化和动态的方式捕获文档级上下文信息。针对缺乏对数据集中已有的情感从句缺乏利用的问题,本文为图注意力网络的每一层设计了一个情感过滤模块,根据情感子句计算一个门分数来过滤无关信息。进而,将二者结合,提出了带情感过滤机制的双向层次注意力网络来从两个方向动态地聚合上下文信息并过滤无关信息。实验结果表明,该方法取得了具有竞争力的性能。

论文作者:刘欣(后排左二) 陈俊颖(前排左一) 周文秀(后排右一) 柳庭瑜(前排左二) 杨新兰(后排左三)

论文作者:孙婧伊(左一)范创(左二)陈奕(左三)刘宇瀚(右三)苏航(右二)王乾龙(右一)


× 学术夏令营 招生信息