实验室学生ACL 2020参会汇报
ACL 2020 (The 58th Annual Meeting of the Association for Computational Linguistic) 是自然语言处理领域中最重要的会议,在中国计算机学会的国际学术会议推荐中,ACL为人工智能领域的A类会议。由于受疫情影响,ACL 2020于2020年7月5日至7月10日以线上会议的形式举行。
在这次会议中,实验室2017级博士生徐文涛以第一作者撰写的论文“SEEK: Segmented Embedding of Knowledge Graphs”有幸被接收。

论文内容:
知识图谱的表示学习在推荐、问答、自然语言理解等下游任务中扮演着重要的角色,然而目前存在的一些研究方法并没有很好的权衡模型的复杂度与表达能力之间的关系,基于此,可以将目前的研究方法划分为两大类:
1.模型简单(复杂度低)却对信息的表达能力有限:以 TransE 和 DistMult 为代表,这类方法很容易应用到大规模的真实图谱中,但它们在捕获语义信息(如链接预测)方面却不尽人意。
2.具有高效的信息表达能力,但却引入过多的参数、模型复杂度高:以 TransH、TransR、TransD、Single DistMult、ConvE、InteractE 为典型代表。有研究表明,模型的高复杂度往往会导致较差的可扩展性,由于现实世界的知识图谱包含了大量的三元组,这些模型很难应用到现实世界的大规模知识图谱中。
基于上述描述,本文以权衡模型复杂度和信息表达能力为出发点,提出轻量级的知识图谱表示框架:SEEK,在不牺牲模型复杂度的情况下,实现了具有高度竞争力的信息表达能力。具体有以下三点:
1.充分的特征交互:将嵌入维度划分为多个分割段,并鼓励不同段之间的信息交互。这样,可以在不增加模型参数的情况下获得高效的信息表达。
2.保持关系必要属性:不同的关系属性是非常重要的,特别是关系的对称性和反对称性,在模型中考虑了保持这两种关系特性。
3.高效的得分函数:在设计得分函数时,结合 1和 2,逐步设计出四种得分函数。在这些函数中,可以将以往的一些方法归为 SEEK 的一个特例,所以 SEEK 也是一个通用的框架。
参会感想:
参会过程中,我最大的感受是:论文的质量是最重要的,只有高质量的论文才有机会被接收,并且发挥其影响力。再往后的研究工作中,我们需要在有价值的研究问题上做出一些有创新性的工作,努力地去追求更高的论文质量而不是单纯地追求论文的数量,从而做出真正有价值并且有影响力的工作。
来源:徐文涛