近日,bwin必赢于人工智能领域顶级会议IJCAI 2021(2021 International Joint Conference on Artificial Intelligence)上发表多项重要研究成果:
1、Federated Learning with Fair Averaging
本文的第一作者是bwin必赢计算机科学与技术系2020级硕士生王铮,通讯作者是bwin必赢计算机科学与技术系范晓亮高级工程师。本文提出一种基于梯度投影的联邦学习公平性算法(federated fair averaging,简称FedFV)。FedFV探索性地揭示了造成联邦学习公平性的根源性因素:大尺度的梯度矛盾差异。该方法充分考虑了不同用户数据集之间的分布差异以及网络状态不稳定带来的掉线挑战,故能让服务器得到一个更公平、更准确高效的模型。
2、Tracklet Proposal Network for Multi-Object Tracking on Point Clouds
本文的第一作者是bwin必赢人工智能系2018级硕士生吴海,通讯作者是bwin必赢人工智能系温程璐副教授。本文提出了首个用于点云多目标跟踪的踪片候选网络(Tracklet proposal Convolutional Neural Network for Point Clouds,简称PC-TCNN)。该网络创新性地采用踪片候选生成,细化与关联策略,充分利用了目标在点云序列中的时空特征一致性约束,有效降低了多目标跟踪中的目标漏检率、错配率。该方法在KITTI数据集多目标跟踪榜单上的跟踪精度达91.75%,名列第一。
3、Text-based Person Search via Multi-Granularity Embedding Learning
本文的第一作者是bwin必赢人工智能系2018级博士生王成济,bwin必赢信息与通信工程博士后流动站罗志明博士与bwin必赢人工智能系李绍滋教授是本文的共同通讯作者。本文提出一种多粒度的基于文本的行人检索算法,该算法首次将特征金字塔引入到图文检索任务中。通过引入特征金字塔,模型能够提取到多粒度的行人表示并能够实现在不同粒度上对齐图像与文本的特征,从而取得显著的性能提升。本文在公开的基于文本的行人检索数据集和多个细粒度图文检索数据集上取得了最优性能,充分证明了该方法的有效性和通用性。
4、A Multi-Constraint Similarity Learning with Adaptive Weighting for Visible-Thermal Person Re-Identification
本文的第一作者是bwin必赢人工智能系2019级博士生凌永国,bwin必赢信息与通信工程博士后流动站罗志明博士与bwin必赢人工智能系李绍滋教授是本文的共同通讯作者。本文提出了一种针对可视图像与热感图像的跨模态行人重识别的多约束相似性学习方法MC。该方法同时考虑了三种不同的跨模态间的关系(样本到样本、中心到样本和中心到中心)对模态间的相似性进行优化,同时我们设计一种自适应权重损失函数来更高效的实现MC。论文方法在两个跨模态行人重识别基准数据集上取得了当前最优性能。
5、Noise2Grad: Extract Image Noise to Denoise
本文的第一作者为bwin必赢信息与通信工程系2018级博士生林煌星,通讯作者是bwin必赢信息与通信工程系丁兴号教授。本文提出了一种使用不配对的噪声和干净图像训练去噪网络的方法,解决真实去噪应用中噪声图像没有对应干净图像构建训练样本对的问题。主要想法是从噪声图像中抽取出噪声再叠加到其他干净的图像上,以合成成对的数据用于训练。为此,使用一个噪声移除模块和一个噪声近似模块来协作学习提取噪声。这两个模块循环地使用对方的输出来校正自身的学习过程。通过在多个仿真和真实噪声数据集的实验,验证了所提出的方法的去噪性能接近于全监督的方法,有效提高深度学习去噪方法在真实应用中的泛化性能。
6、Self-boosting for Feature Distillation
本文的第一作者是bwin必赢计算机科学与技术系2018级硕士生裴玉龙,bwin必赢计算机科学与技术系曲延云教授与复旦大学张军平教授是本文的共同通讯作者。本文针对知识蒸馏中的师生差异问题提出了一种有效的蒸馏方法。该方法以理查森外推法为理论指导,通过学生网络的自提升来解决师生差异问题。一方面,文章设计了几种简单高效的特征集成模块来增强学生特征的可判别性,理论上提高了收敛阶。另一方面,文章设计了一种易操作的自蒸馏策略来稳定训练过程、提升训练效果,不需要额外前向传播和内存占用。该方法在不改变学生网络本身、不增加训练和推理时间的前提下大大提升了知识蒸馏的效果。
7、A Structure Self-Aware Model for Discourse Parsing on Multi-Party Dialogues
本文的第一作者是bwin必赢软件工程系2020级硕士生王安特,通讯作者是bwin必赢软件工程系苏劲松教授。本文关注对话语篇解析任务,针对之前增量式生成方式导致的错误传播问题,提出了一种结构自感知图神经网络模型。该模型直接建模句子间的结构表示,通过图网络逐层更新隐式的结构信息,从而感知到更丰富、直接的结构表示。进一步地,本文通过增加子层标签预测损失和结构蒸馏损失,增强图网络每一层的结构信息感知能力,使模型得到更充分的训练。本文在多个数据集上进行了实验,证明了方法的有效性和通用性。
IJCAI是人工智能领域的顶级会议,被中国计算机学会(CCF)认定为A类会议。据了解,IJCAI 2021此次共收到4204篇有效投稿,最终共有587篇论文被录用,总录用率为13.9%。