实验室多名学生ADMA2023参会汇报
2023年8月21日-8月23日,第19届高级数据挖掘与应用国际会议(ADMA 2023)在沈阳东北大学国际交流中心成功举行。ADMA是数据挖掘领域的知名国际学术会议,为中国计算机学会推荐的CCF C类国际会议。本次会议由Xue Li担任指导委员会主席,Bin Wang、Jing Jiang担任程序主席。会议还邀请了嘉宾吴信东、Kyuseok Shim、周晓方、陈贵海、崔斌作特邀报告。

实验室博士研究生王世祺、硕士研究生甘梦娇、林妙培、刘光亚、郭秋彤、张轩铭共有6篇论文被接收,并以现场汇报和预录视频的方式进行报告。6篇论文均受到国家自然科学基金、广东省重点研发计划等项目资助和广东省大数据分析与处理重点实验室的支持。被接收论文具体情况如下。
实验室博士研究生王世祺的论文“A Knowledge-Enhanced Inferential Network for Cross-Modality Multi-hop VQA”被接收。

论文内容:
本文聚焦跨模态多跳视觉问题,这些问题需要对来自多种模态(例如图像和文本)的不同知识源进行多跳推理。由于缺乏跨模态推理能力,传统模型很难做出正确的预测。为了解决这个问题,我们提出了一种新的知识增强推理框架。我们首先构建一个推理图来捕获给定图像中的对象之间的拓扑关系以及与这些对象对应的实体的逻辑关系。为了对齐视觉对象和文本实体,我们在外部多模态知识图的帮助下设计了一个跨模态检索器。根据图上的逻辑和拓扑关系,我们可以通过将复杂的多跳问题分解为一系列基于注意力的推理步骤来得出答案。上一步的结果将作为下一步的上下文。通过链接所有步骤的结果,我们可以形成答案的证据链。在流行的 KVQA 数据集上进行的广泛实验证明了我们方法的有效性。
实验室硕士研究生甘梦娇的论文“Generating Enlightened Suggestions based on Mental State Evolution for Emotional Support Conversation”被接收。

论文内容:
情感支持对话旨在为用户提供安慰和建议,逐步减轻他们的焦虑等负面情绪。对于心理健康支持和客户服务聊天等许多应用来说,这是一个很有价值的话题。然而,由于缺乏足够的专家知识,现有方法无法提供有启发性的建议来解决用户的担忧。此外,这些方法还忽视了对用户心理状态演变的把握。为了解决这些问题,我们提出了一种考虑心理状态演变的新方法,以提供基于知识的建议。具体来说,我们首先创建了一个名为 "MentalQA "的语料库,借助心理健康论坛来掌握心理学知识。我们根据上下文和原始回复选择相关段落。然后,我们利用图结构将推断出的用户心理状态演变丰富到上下文中。此外,我们还引入门机制结合文本专家知识与心理状态演变图,从而促进支持性回复的生成。实验结果表明,这种方法可以提供合理的解决方案来帮助用户。
实验室硕士研究生林妙培的论文“Spatial Commonsense Reasoning for Machine Reading Comprehension”被接收。

论文内容:
本文研究机器阅读理解任务的空间常识推理问题。空间常识是人类共享的关于物体形状、大小、距离和位置的潜在知识。推理这种抽象知识可以帮助机器更好地感知周围环境,这对于通用智能至关重要。然而,这个有价值的话题具有挑战性,并且研究较少。为了弥补这一研究空白,我们专注于这一主题并提出了一种实现空间推理的新方法。给定一个文本,我们首先基于其解析树构建一个潜在的推理图。为了更好地支持空间推理,我们从外部知识源中检索相关的常识实体和关系,包括预训练的语言模型(LM)和知识图(KG)。LM 涵盖了各种事实知识,KG 拥有丰富的常识关系。然后,我们提出了一种称为 LEGRN(LM Edge-GNN Reasoner Networks)的融合方法来融合文本和图。LEGRN 采用基于层的注意力机制来集成 LM文本编码器和 KG 图编码器,可以捕获 LM 文本上下文和 KG 图结构之间的相关性。 考虑到空间关系涉及多种属性,我们提出一个属性感知推理网络来推断正确答案。为了评估我们的方法,我们构建了一个名为 CRCSpatial 的新的大型数据集,其中包含 4 万个空间常识推理问题。实验结果说明了我们方法的有效性。
实验室硕士研究生刘光亚的论文“Multi-modal Multi-emotion Emotional Support Conversation”被接收。

论文内容:
这篇文献提出了一项名为多模多情感情感支持对话(MMESC)的新任务,该任务在各种应用中具有重要价值,如心理咨询、日常聊天和陪伴老年人。该任务旨在通过多种模态充分感知用户的情感状态,并生成适当的回复,以提供安慰,改善他们的情绪。传统的工作主要集中在文本对话上,而单一模态无法准确反映用户的情感,比如说“我很好”却实际上很难过。为解决这个问题,我们提出了一个涉及多种模态的新任务,并采用一种名为 FEAT 的新方法。FEAT 能够整合来自多个模态的细粒度情感知识。它首先基于情感感知的转换器识别用户的心理状态,然后利用多种安慰策略的混合方法生成支持性的回复。为了评估我们的方法,我们构建了一个名为 MMESConv 的大规模数据集。它几乎是现有单一模态数据集的两倍大。该数据集包含三种模态(文本、音频和视频),具有细粒度的情感注释和策略标签。在这个数据集上进行的广泛实验证明了我们提出的框架的优势。
实验室硕士研究生郭秋彤的论文“Discovery of Emotion Implicit Causes in Products based on Commonsense Reasoning”被接收,并荣获最佳学生论文奖。

论文内容:
本文聚焦于产品情感原因分析任务,旨在从产品评论中找到某些情感的关键原因。现有的研究只研究了文本中的显式原因,也就是给定文本中的一些片段。然而,一些关键而有用的原因可能表达得很含糊。它们可能没有提到,但可以从文本语义中推断出来。它们可以捕捉到更深层次的原因来解释一些未知现象,这可以很好地支持市场研究和产品优化等应用。为了解决这个问题,我们在这篇论文中提出了一个新的任务,即情感隐含原因发现(EICD)。我们开发了一种新颖的方法,可以基于上下文和常识知识推断隐含原因。我们的方法首先从大型语言模型中检索相关知识,以构建情感和潜在原因的推理图。然后我们编码图中的结构性知识,并通过演绎推理来推断隐含原因。为了评估我们的方法,我们基于亚马逊产品评论构建了一个大型数据集,称为 EICD 集。在此数据集上进行的实验证明了我们模型的有效性。
实验室硕士研究生张轩铭的论文“Community Detection in Temporal Biological Metabolic Networks based on Semi-NMF Method with Node Similarity Fusion”被接收。

论文内容:
本文旨在研究生物代谢网络的拓扑结构,例如检测其内在的社团,以了解有用的模式和特征。通过将代谢网络分成多个社团和子图,可以揭示它们的局部结构和组织。这有助于研究人员更好地理解代谢网络的结构和功能,识别代谢途径和功能模块,并发现代谢调控的机制和模式。然而,由于代谢网络结构的动态性和数据稀疏性,社团检测仍然是一个具有挑战性的问题。为了解决这个问题,本文提出了一种新的用于生物代谢网络的时间社团检测方法,基于半NMF框架和节点相似性融合,被称为SNF-MNet。该方法通过引入时间平滑性来估计网络的演化,从而把握代谢网络的动态性质。此外,SNF-MNet采用了一种节点相似性融合方法,全面考虑了网络中节点之间的关系,有效解决了现有方法的限制和数据稀疏性问题。SNF-MNet可以有效降低噪音的影响,提高小型社团的可区分性,提供更准确和可靠的结果。对多个合成和真实数据集进行的实验显示了该模型在社团检测和时间演化跟踪方面的有效性,NMI提高了1%至3.2%。