计算机学院宣(文/图 李莉) 2014年11月07日下午14:00,应智能计算研究中心教师的诚挚邀请,中国科学院软件研究所研究员、博士生导师孙乐博士在A502为我院师生做了一场题为“基于知识的文本理解:实体链接与实体关系抽取”的学术报告。在这次报告中,他一方面介绍了如何利用信息抽取技术从文本语料库中获取知识;另一方面介绍了如何基于知识来进行文本理解。孙乐博士首先概述文本的理解的重要作用,文本自动理解是自然语言处理中的核心研究问题,广泛应用于搜索引擎、问答系统、机器翻译等应用系统。最后结合其研究组最近的几篇在实体链接与实体关系抽取方面的文章介绍了如下三个方面的研究成果,一是针对实体链接任务的几个模型:实体-提及模型、图模型、实体-主题模型;二是一种获取实体的协同自举方法;三是一种用于抽取实体间关系的稀疏表示方法。
报告结束之后,孙乐博士认真解答了在场师生提出的几个问题:如何去实现基于语义的文本理解;如何实现文本中实体的识别;不同的文本中提出的一部分实体关系可能会极其相似,而我们应该如何去识别这些比较相似的实体关系以减少实体关系库中冗余性。他对这些问题依次做出了解答并给出了独到的见解。之后孙乐博士与智能计算研究中心的老师们进行了座谈,畅谈彼此专业领域的共同之处,相互学习,探讨今后科研合作的可能性。
孙乐博士简介:
中国科学院软件研究所,研究员,博士生导师。中国中文信息学会副理事长兼秘书长。《中文信息学报》副主编。2003至2005年,先后在英国Birmingham大学、加拿大Montreal大学做访问学者,从事语料库和信息检索研究。目前主要研究兴趣:基于知识的语言理解、信息抽取、问答系统、信息检索等。在国内外主要刊物和会议上共发表论文80多篇。2008和2009国际测评NTCIR MOAT中文简体任务的组织者、国际计算语言学大会(COLING 2010)组织委员会联席主席、机器翻译峰会(MT Summit 2011)组织委员会联席主席、中文语言评测国际会议(CLP2010、2012、2014)大会主席、国际计算语言学年会(ACL 2015)组织委员会联席主席。