3D目标检测多模态融合算法综述

最新推荐文章于 2025-07-27 20:14:34 发布

3Ｄ视觉工坊

最新推荐文章于 2025-07-27 20:14:34 发布

阅读量3.3k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： 3D视觉从入门到精通文章标签：算法计算机视觉机器学习人工智能编程语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Yong_Qi2015/article/details/108505564

3D视觉从入门到精通专栏收录该内容

634 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

本文综述3D目标检测中的多模态融合方法，探讨传感器视角问题、数据表征差异和信息融合挑战。文章介绍了点云与图像融合的关键，以及早期融合、深度融合和晚期融合策略，特别讨论了基于voxel和point的特征融合方法，如3D-CVF和PI-RCNN。

0前言

本篇文章主要想对目前处于探索阶段的3D目标检测中多模态融合的方法做一个简单的综述，主要内容为对目前几篇几篇研究工作的总结和对这个研究方面的一些思考。
在前面的一些文章中，笔者已经介绍到了多模态融合的含义是将多种传感器数据融合。在3D目标检测中，目前大都是将lidar和image信息做融合。在上一篇文章中，笔者介绍到了目前主要的几种融合方法，即early-fusion,deep-fusion和late-fusion，并介绍了一种基于Late-fusion的融合方法。但是在大多数研究工作中，都是以deep-fuion的方法为主要的融合策略。

1背景知识

1.1多模态融合的主要难点

难点一：传感器视角问题

3D-CVF（ECCV20）的研究提出的做fusion的对做融合工作最大的问题即是在视角上的问题，描述为如下图所示的问题，camera获取到的信息是“小孔成像”原理，是从一个视锥出发获取到的信息，而lidar是在真实的3D世界中获取到的信息。这使得在对同一个object的表征上存在很大的不同。

难点二数据表征不一样

这个难点也是所用多模态融合都会遇到的问题，对于image信息是dense和规则的，但是对于点云的信息则是稀疏的

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

3Ｄ视觉工坊 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。