首个实时单目3D目标检测算法:RTM3D,代码将开源

基于单目图像的3D目标检测是在输入RGB图像的情况下估计目标的3D包围框,在自动驾驶领域非常有用。

今天来自中科院沈阳自动化所等单位的学者公布论文提出一种实时的单目3D目标检测算法RTM3D,快速版30fps,并且代码将开源。

以下是作者信息:

RTM3D算法的主要思路,如图:

输入RGB图像,经过深度神经网络,预测目标的9个空间点(1个中心点,8个顶点),使用几何限制估计更加精确的9个空间点,进而找到目标的3D包围框。

下表为该文算法与其他3D目标检测方法比较,RTM3D不需要其他外部数据,而且速度达到实时。

算法架构图:


实验结果

在KITTI数据集上的实验结果,该算法在精度达到SOTA的同时,是目前少数达到实时的3D目标检测算法。

检测结果示例:

论文地址:

https://arxiv.xilesou.top/pdf/2001.03343.pdf

代码地址:

https://github.com/Banconxuan/RTM3D

目前代码还未放出,期待早日开源。

我爱计算机视觉
我爱计算机视觉

关注计算机视觉与机器学习技术的最前沿,“有价值有深度”,分享开源技术与最新论文解读,传播计算机视觉与机器学习技术的业内最佳实践。

理论算法RTM3D3D目标检测
1
相关数据
深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

3D目标检测技术

3D目标检测主要对对象类别进行分类,并根据3D传感器数据估算物理对象的定向3D边界框。

推荐文章
暂无评论
暂无评论~