-
1、现在主流的是(0/1/2 Lidar+ (1/3/5) Radar+ (5/6/7) Camera。纯视觉BEV一般用6或7V。具体可以参考: https://t.zsxq.com/0fy5fLQBo ;一篇综述也介绍了: https://arxiv.org/pdf/2106.10823、https://arxiv.org/pdf/2206.09474、 https://arxiv.org/pdf/2202.02980
-
2: 3D目标检测分很多种,有单目、双目、多目、激光雷达、多传感器融合,都是可以直接预测目标的3D坐标 (x,y,z,尺寸、方向、角度等) ,2D方法首先从2D 特征中估计2D 位置,方向和尺寸,然后从这些结果(和其他一些中间结果)恢复3D 位置。可以参考之前的文章:纯视觉3D检测综述一文详解3D检测现状趋势和未来方向-知乎
-
3、2D+深度估计方法在总体框架上类似于2D检测器,为了更好地表示,可将其分为两个子类: 基于区域的方法和单目方法。可以参考之前的文章:纯视觉3D检测综述一文详解3D检测现状趋势和未来方向-知乎
-
4、BEV方法现在是需要多个视角的图像的,这也是现在多V (5/6/7V) 流行的配置。具体可以参考:史上最全BEV感知算法综述基于图像Lidar多模态数据的3D检测与分割任务-知乎
-
5、单目深度估计还很难,双目或多目会好一些,不过匹配是个难点。