计算机视觉工坊 汇总|基于激光雷达的3D目标检测开源项目&数据集( 三 )


计算机视觉工坊 汇总|基于激光雷达的3D目标检测开源项目&数据集
文章图片
LyftLevel5
官方网址:https://level5.lyft.com/dataset/?source=post_page
该数据集目前也是经常在论文中读到过的数据集 , 和KITTI数据集一样采用64线雷达和多个摄像头采集数据得到 。 数据集包括高清语义图 , 该地图具有4,000多个手动注释的语义元素 , 包括车道段 , 人行横道 , 停车标志 , 停车区 , 减速带和减速带等 。
计算机视觉工坊 汇总|基于激光雷达的3D目标检测开源项目&数据集
文章图片
H3D
数据集官网链接:https://usa.honda-ri.com/H3D
文章链接:https://arxiv.org/pdf/1903.01568
由本田公司提供的用于自动驾驶场景的点云目标检测数据集 , 该数据集是从HDD数据集收集的 , HDD数据集是在旧金山湾区收集的大规模自然驾驶数据集 。 H3D拥有完整的360度LiDAR数据集(来自Velodyne-64的密集点云) , 1071302个3D边界框标签 。 该数据集也是包含时序信息的 。 每2HZ手动注释一次并线性传播10HZ 。
计算机视觉工坊 汇总|基于激光雷达的3D目标检测开源项目&数据集
文章图片
BLVD
数据集连接:https://github.com/VCCIV/BLVD
文章链接:https://arxiv.org/pdf/1903.06405
该数据集主要侧重点在其数据集关注点在车辆自我周围物体的有意义的动态变化 , 因此引入了这么一个数据集BLVD , 这是一个大规模的5D语义基准 , 它没有集中于之前已经充分解决的静态检测或语义/实例分割任务 。 取而代之的是 , BLVD旨在为动态4D(3D+时间)跟踪 , 5D(4D+交互式)交互式事件识别和意图预测的任务提供一个平台 。 BLVD数据集包含654个高分辨率视频剪辑 , 这些剪辑来自中国江苏省常熟市 , 提取了120k帧 。 官方完全注释了所有帧 , 并总共产生了249129个3D标注 , 以进行跟踪和检测任务 。
计算机视觉工坊 汇总|基于激光雷达的3D目标检测开源项目&数据集
文章图片
PreSIL
官方链接:https://uwaterloo.ca/waterloo-intelligent-systems-engineering-lab/projects/precise-synthetic-image-and-lidar-presil-dataset-autonomous
文章链接:https://arxiv.org/abs/1905.00160
该自动驾驶数据集由滑铁卢大学提供和分享 , PreSIL数据集包含50,000多个实例 , 包括具有完整分辨率深度信息的高清图像 , 语义分割(图像) , 逐点分割(点云) , gt标签(点云)以及所有车辆和行人的详细标注 。 官方通过在对最先进的3D对象检测网络进行数据预训练后 , 在KITTI3D对象检测基准测试中显示出高达5%的平均精度提高 , 从而证明了数据集的有效性 。 该数据集尚未公布 。
计算机视觉工坊 汇总|基于激光雷达的3D目标检测开源项目&数据集
文章图片
WAD
官网链接:http://wad.ai/2019/challenge.html
该数据集由百度公司提供 。 该数据集的3DLidar对象检测和跟踪数据集由具有高质量label标注的LiDAR扫描点云组成 。 它是在中国北京各种照明条件和交通密度下收集的 。 更具体地说 , 它包含了非常复杂的交通流 , 其中混杂着车辆 , 骑自行车的人和行人 。 数据集包含了大约53分钟的训练序列和50分钟的测试序列组成 。 以每秒10帧的速度捕获数据 , 并以每秒2帧标注数据 。
计算机视觉工坊 汇总|基于激光雷达的3D目标检测开源项目&数据集
文章图片
PASCAL3D+
官网链接:https://cvgl.stanford.edu/projects/pascal3d.html
该数据集是对PASCAL数据的一个3D模型重建 , 更像是一个分类和POS检测数据集 。
计算机视觉工坊 汇总|基于激光雷达的3D目标检测开源项目&数据集
文章图片
TheStanfordTrackCollection
官方链接:https://cs.stanford.edu/people/teichman/stc/


推荐阅读