实验室博士生董浩业参加国际会议ICME2019

发布人:罗倩 发布日期:2019-07-26

     2019年7月8日-12日,实验室博士生董浩业作为论文第一作者参加了国际会议ICME2019并做报告。ICME全称IEEE International Conference on Multimedia and Expo,属于CCF推荐B类会议,在多媒体、计算机视觉、人工智能领域具有一定的影响力。2019年ICME在中国上海召开,本次会议收到来自全球36个国家或地区的regular paper投稿1002份,打破会议投稿记录,录用313份。自2010年起,各年份的投稿和接收情况如下图所示。

图1,历年投稿与录用情况
图1,历年投稿与录用情况

      董浩业同学参会的论文题目是:“Part-Preserving Pose Manipulation for Person Image Synthesis”。主要内容是:本文研究是问题是pose transfer,在不同的姿态下操纵人的图像,将人从一个姿势转移到另一个想要的姿势,是一项有趣而又具有挑战性的任务,因为它具有较大的非刚性空间变形。由于缺乏明确的约束和空间建模,现有的大部分工作都无法保持细密的外观一致性和姿态的变化,导致严重的工件产生不现实的结果。在本文中,我们提出了一种新的细节保持的生成对抗网络(PP-GAN),通过在生成器上施加丰富的结构约束来获得良好的生成图片质量。PP-GAN提出将人体具有挑战性的空间转换分解为细粒度的部分级转换,然后通过人体关节结构约束将其集成。给定任意的姿态,PP-GAN将人体关节结构和区域级部件线索作为输入进行显式生成建模。另一方面,在PP-GAN中引入了一种parsing一致性损失,以增强不同姿态图像之间的语义一致性,从语义的角度指导图像合成。对两个基准的广泛定性和定量评估表明,我们的PP-GAN在生成更真实和可信的图像合成结果方面显著优于最先进的基线。在最具挑战性的姿势变化情况,以往的工作往往很容易失败,而PP-GAN能很好地保持了细节保留的特点。

图2,实验室同学海报展示环节
图2,实验室同学海报展示环节

      参会总结:实验室论文吸引了同行的广泛关注,纷纷表示该工作具有巨大的应用价值和理论研究意义。本论文属于董浩业同学博士期间第一篇投稿,历经几次顶会的拒稿,根据宝贵的审稿意见做了多次改版,最终被ICME录用。他说,要敢于投顶会,多尝试CCF A的投稿,就算不幸运,也是能收获宝贵的审稿意见,转投CCF B类,中奖的概率会更大。同时他觉得,有意义的研究生生活应该是:每天都在DDL路上,每位研究生都应该看下凌晨四点的中大牌坊。

      近日,董浩业同学两篇一作paper被人工智能与计算机视觉顶级会议ICCV2019接收。