您现在的位置是:主页 > 品牌 > 阿里巴巴 >
同济大学与阿里巴巴荣获中国首个CVPR最佳学生论文奖,时隔二十余年再创佳绩
发布时间:2022年06月24日 11:30:27 阿里巴巴 人已围观
简介全球人工智能领域的重要大会CVPR近日宣布,将2022年“最佳学生论文”奖授予同济大学研二学生陈涵晟及其团队。这一荣誉标志着中国高校学生在国际学术界的首次获奖,反映了中国在人...
全球人工智能领域备受瞩目的会议CVPR近日宣布,同济大学研究生陈涵晟等人荣获2022年“最佳学生论文”奖。这是二十多年来中国高校学生首次获得此项荣誉。该论文是陈涵晟在阿里达摩院实习时的研究成果,结合了传统几何推理与深度学习,提出了一种新方法来计算3D物体的位姿,能够从单幅图像中推算出物体在真实环境中的位置与朝向,未来有望推动自动驾驶与机器人等技术的发展。
CVPR(国际计算机视觉与模式识别会议)为人工智能领域的顶尖学术会议。今年上传了8161篇论文,其中2064篇被筛选录取,仅评选出最佳论文与最佳学生论文各一篇。CVPR的最佳论文和最佳学生论文通常被视为AI技术的风向标,曾催生了ResNet等一系列重要成果。
CVPR自2001年设立最佳学生论文奖,今年首次将此奖授予中国高校的学生。获奖论文《EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation 》的作者包括同济大学汽车学院与阿里巴巴达摩院的陈涵晟、王丕超、王帆、田炜、熊璐与李昊。
获奖证书
这篇论文研究了3D视觉领域的经典课题,即通过单张图像推导3D物体在真实世界中的位姿(包括位置和朝向)。这一技术具有广泛的应用前景,对于自动驾驶、机器人等行业尤为重要。例如,在自动驾驶应用中,车辆只有在准确计算周围车辆的位姿后,才能判断其行为,比如加速、刹车或是变道,从而避免事故的发生。
3D物体位姿计算示意图
通过单张图像进行3D物体定位是一项极具挑战性的任务。通常有两种解决方式:一种是基于几何推理的方法,例如PnP算法,它具有良好的可解释性和泛化能力,但需要事先知道物体的尺寸和形状,因此存在一定局限性;另一种是深度学习算法,能够预测3D物体的坐标和角度,但在小规模数据集上容易出现过拟合现象。
获奖论文中提出的新方法EPro-PnP具有创新性地将概率分布引入其中,巧妙地将几何推理与深度学习两者整合,形成一个端到端的使用模型,能够迅速估算出3D物体的位姿。实验证明这一新模型具有很强的通用性和高效的定位准确度,且无须事先了解物体的几何形状;更重要的是,它简洁高效且具备良好的可解释性,未来或将应用于自动驾驶、机器人、无人机、增强现实等多种需要通过视觉估算物体位姿的场景中。
EPro-PnP方法示意图