第四届江苏人工智能大会自然语言处理前沿论坛成功举办

由 苏智会 发布于 2022-01-04

2021年12月27日下午,“江苏人工智能大会(JSAI2021)自然语言处理前沿论坛”线上会议成功举办。本次论坛由江苏省人工智能学会自然语言处理专业委员会和南京师范大学计算机与电子信息学院联合主办。


图1 JSAI 2021自然语言处理前沿论坛

论坛活动采用线上方式进行,利用腾讯会议平台展开学术交流,同时在bilibili平台直播,备受网友关注。此次会议不仅仅局限于线上汇报者之间的交流,更为广大观看直播的同学和网友提供了一场学术盛宴!会议吸引了南京大学、东南大学、苏州大学、南京理工大学、南京师范大学、中国矿业大学、江苏师范大学、苏州科技大学、山东大学等省内外高校师生,以及相关领域科技工作者的积极参加,在线参会人数约200余人。论坛开幕式由自然语言处理专委会副主任、南京师范大学周俊生教授主持,自然语言处理专委会主任、苏州大学周国栋教授做开幕致辞。


图2 从文本到图谱:知识抽取与探测

首先,由国家优青获得者、中国科学院软件研究所研究员韩先培作特邀报告,报告题目为”从文本到图谱:知识抽取与探测“,韩老师首先指出如何获取知识是知识图谱构建的一大挑战,然后从两条路线对知识获取进行了探讨:(1)从文本中抽取;(2)从大规模预训练语言模型中探测。报告指出,上述两条路线各有所长,相互补充,可共同为知识的大规模获取提供支撑。韩先培老师为中科院软件所研究员,担任中文信息处理实验室副主任,入选国家优青、中国科协青年人才托举计划及北京智源青年科学家。承担中科院战略先导、科技创新2030课题、国家重点研发专项等十余项课题。在ACL、SIGIR、IJCAI等重要国际会议发表论文60余篇,并担任中国中文信息学会理事及语言与知识计算专业委员会副主任。其相关成果获中国中文信息学会汉王青年创新奖一等奖及科学技术奖一等奖。

随后,来自省内南京大学、东南大学、苏州大学、南京理工大学等从事自然语言处理研究的5位博士和硕士研究生,围绕自然语言处理中汉语词内部结构研究、事实检测任务、词汇翻译的一致性、提高机器翻译性能、比较五元组抽取等热点问题分别作了精彩报告,分享发表在AAAI、EMNLP等顶会上的最新研究成果。前沿技术报告由南京师范大学计算机与电子信息学院副院长顾彦慧老师主持。


图3 汉语词内部结构深层研究

来自苏州大学的龚晨博士的报告题目为“汉语词内部结构深层研究“。龚博士指出之前相关的工作对于汉语词内部结构的研究太过浅层,没有细粒度的依存关系研究。为了解决此问题,其对汉语词内部结构展开研究,分析构成词的各个字之间的依存关系。其通过深入调研语言学中的构词法以及现有依存句法标注规范,设计依存标签表示词内部的依存关系类型,人工标注词的内部结构,并提出了两种编码词内部结构的方法,在句法分析任务中验证了汉语词内部结构的作用。龚博士目前就读于苏州大学,主要研究方向为词法、句法、信息抽取等相关工作,以一作身份在ACL、EMNLP、COLING、等会议和期刊发表多篇学术论文。


图4 考虑主题关联性和隐式立场关系的事实检测

来自东南大学的司加胜博士带来题为“考虑主题关联性和隐式立场关系的事实检测”的学术报告。司博士首先指出当前互联网充斥着海量的信息,如何对信息的真实性进行辨别是NLP社区研究的热点。针对事实检测任务,大多关注陈述文本和证据文本之间的语义关联性建模,较少人关注在语义关联性之外的问题。他提出了是否存在其他的关联性建模方式的猜想,从主题关联性和隐式立场的角度出发,从不同方面探究了主题信息和隐式立场对事实检测任务的作用。司博士目前就读于东南大学,主要研究方向为可解释性事实检测,论辩挖掘等。


图5 鼓励篇章级神经机器翻译中词汇翻译的一致性

来自苏州大学的吕星林博士的报告题目是”鼓励篇章级神经机器翻译中词汇翻译的一致性“。吕博士首先介绍了在句子级翻译中,相同单词的翻译一致性很弱的问题。为了解决该问题,吕博士提出在篇章级NMT 中应用“每个篇章一种翻译”的思想,鼓励篇章级NMT词汇翻译的一致性。通过实验证明,在中英和英法翻译任务上,他们不仅在 BLEU 分数上达到了最优的性能,还大大提高了词汇翻译的一致性。吕博士目前就读于苏州大学,研究兴趣为篇章级神经机器翻译,相关工作已在EMNLP会议中发表。


图6 在线学习用户反馈提高机器翻译性能的非参数化方法

来自南京大学的王东琪带来的报告题目是“在线学习用户反馈提高机器翻译性能的非参数化方法“。她指出,以前的方法如在线更新模型或者利用记忆网络的形式建模翻译记忆,需要在翻译模型上进行额外的训练或结构更改,这是不灵活且不高效的。为此提出一种非参数化的在线学习用户反馈的方法,在预训练翻译模型的基础上引入了两个KNN模块。最后,研究表明,他们的方法一方面提高了翻译性能,另一方面减少了用户的纠正次数,提升用户体验。王东琪目前就读于南京大学计算机系,为自然语言处理课题组三年级研究生,主要研究方向为自然文本生成、机器辅助翻译和非自回归机器翻译。


图7 比较五元组抽取

来自南京理工大学的刘子恒带来的报告题目是“比较五元组抽取”。刘子恒在报告中指出以往的大多数研究将比较关系抽取视为比较要素抽取,而忽略了比较句可能包含多个比较的情况。为了解决这些缺陷,他们提出了一个新的任务:比较五元组抽取(COQE)任务,从商品评论中识别比较句并抽取所有比较五元组。此外,构建了三个数据集并提出了基于比较要素抽、比较要素组合过滤和比较倾向性分类的多阶段方法。最终,实验结果表明了该方法的有效性。刘子恒目前就读于南京理工大学计算机学院硕士研究生,主要研究方向为比较观点挖掘。

会议过程中的每个报告结束后,老师和同学们都积极讨论,会场气氛热烈,大家收获颇丰。最后,自然语言处理专业委员会秘书长、苏州科技大学智慧城市研究院副院长奚雪峰老师对本次论坛进行了总结并对大力支持和积极参与本次会议的专家学者和同学们表示了感谢。本次自然语言处理前沿论坛圆满结束。

论坛主办方南京师范大学自然语言处理研究团队始建于2008年,该研究团队包含来自含计算机人工智能和语言学等不同方向的研究人员,充分发挥人工智能与语言学两个学科交叉的优势,面向自然语言处理领域的基础语言分析问题和实际的教育应用问题开展深入的探索研究。近年来,该团队主要关注中文句子抽象意义表示CAMR的标注规范设计与语料库开发和解析模型与算法的设计、面向儿童语言能力评估的叙事与阅读能力智能评价方法与模型研究,以及文本的结构化数据提取及其应用研究等方向。

近年来,团队在IJCAI、ACL、EMNLP、NLPCC、CCL等人工智能和自然语言处理领域重要的国内外学术会议上发表论文三十余篇,先后两次获得CCL最佳论文奖。如果你也有共同兴趣或目标,欢迎加入南京师范大学自然语言处理研究团队!

论坛联合主办方江苏省人工智能学会自然语言处理专业委员会(Technical Committee on Natural Language Processing,缩写JSAI-NLP)是由江苏省内从事自然语言处理研究及应用的科技工作者组成的专业团体。专委会于2020年10月由苏州大学、南京大学、东南大学、南京理工大学、南京师范大学、苏州科技大学共六家单位发起成立,主要聚焦自然语言处理基础理论和方法、分词、句法分析、篇章分析、文本分类、机器翻译、自动问答、信息抽取、信息检索、自动摘要、自然语言理解、自然语言生成等的研究及应用实践。 JSAI-NLP专委会团结、联合、组织江苏省自然语言处理研究及应用相关领域的专业人士,开展学术/技术交流、发展战略研究、专业技术标准制定、专业资格认可、专业培训等相关活动,提高自然语言处理科研、教学、应用水平,促进研究成果的应用和向产品的转化,提升在省内外科技活动和国际学术方面的影响力(专委会秘书处联系信息 奚老师 xfxi2009@qq.com)。

  • 智领江苏(资讯)

  • 加入JSAI学会