『3D视觉工坊』自动驾驶综述|定位、感知、规划常见算法汇总( 六 )


(6)DeepLearningBasedMOT基于深度学习的方法利用深度神经网络检测运动障碍物的位置和几何特征 , 并基于当前摄像机数据跟踪其未来状态 。
5、交通信号检测与识别交通信号检测识别子系统负责对交通规则中定义的标志进行检测和识别 , 使车辆能够根据交通规律做出正确的决策 。 与交通信号相关的任务有很多 , 在本文中 , 我们将探讨三个主要主题:交通灯、交通标志和自动驾驶汽车周围环境中的路面标记 。
(1)TrafficLightDetectionandRecognition红绿灯检测和识别包括检测汽车周围环境中一个或多个红绿灯的位置(例如 , 在图像中表示)并识别其状态(红色、绿色和黄色) 。 文献中提出了各种交通灯检测和识别方法 。 在这里 , 我们只回顾最新的和相关的 。 交通信号灯的检测与识别方法主要分为两类:基于模型的方法和基于学习的方法 。 交通灯在颜色和形状信息方面有一个明确的结构 。 一个普通的红绿灯有三个灯泡(每个州一个:红色、绿色和黄色)和一个清晰的形状 。 因此 , 早期的交通灯检测和识别方法大多是基于模型的 。 这些方法依赖于手工制作的特征工程 , 它试图利用人类掌握的关于物体颜色和形状的信息来建立一个能够检测和/或识别物体的模型 。 当假设没有严格遵守时 , 使用颜色和形状信息的方法是不可靠的 。 为了增强其鲁棒性 , 提出了一种不同特征(如颜色、形状和结构)的组合 。 例如提出了一个多特征系统 , 该系统结合了颜色(使用颜色分割)、形状/结构(使用黑盒检测)和地理信息(仅在预期有已知红绿灯时使用该系统) 。 然而 , 他们的系统在基于模型的方法中普遍存在大量的超参数 , 这通常意味着在某些情况下需要重新校准 。 作者在一个内部私有数据集上进行了实验 , 并指出故障是由于过度曝光、遮挡、交通灯的非标准安装以及其他一些在现实情况下并不罕见的情况造成的 。 在基于模型的方法的背景下 , 这种结合表明是不够的 。 因此 , 研究者开始引入基于学习的方法 。 在基于学习的方法中 , 特征仍然是手工制作的 , 但是检测和/或识别过程从基于规则变为基于学习 。 主要方法包括传统机器学习方式和深度学习方式 。
(2)TrafficSignDetectionandRecognition交通标志检测与识别包括检测环境中交通标志的位置并识别其类别(如限速、停车和让行标志) 。 与基于模型的方法相比 , 基于学习的方法得到了改进并取得了更好的结果 。 随着深度学习在一般计算机视觉任务中的兴起 , 卷积神经网络已成为交通标志检测和识别领域的研究热点 , 在GTSRB和BTS的识别任务中分别达到了F1分数的99.71%和98.86% 。
(3)PavementMarkingDetectionandRecognition路面标线检测与识别包括检测路面标线的位置并识别其类型(如车道标线、道路标线、信息和人行横道) 。 路面标线检测与识别包括检测路面标线的位置并识别其类型(如车道标线、道路标线、信息和人行横道) 。
大多数研究一次只处理一种路面标线 , 而不是同时处理所有标线 。 这可能是因为既没有一个广泛使用的数据库 , 也没有一个共识 , 即研究人员在处理路面标线检测和识别时 , 应该关注哪些符号集 。 一个重要的路面标记是道路中的车道定义 。 早些时候 , 大多数车道标记检测方法都是基于模型或学习的 。 形状和颜色是最常见的特征 , 直线和曲线是最常见的车道表示 。 在BER17c中 , 作者提出了一个完整的自我车道分析系统 。 在这些系统的特点中 , 作者声称能够检测车道及其属性、人行横道、车道变换事件和一些路面标线 。 作者还发布了用于评估这些类型系统的数据集 。 深度学习是最近流行的另一种方法 , 像GUR16这样的方法已经显示出很好的效果 。 作者建议(i)使用两个横向安装的下向摄像机 , (ii)将横向距离估计建模为一个分类问题 , 其中他们使用CNN来处理该任务 。 在这种情况下 , 他们主张在一个私人数据库中以小于2像素的平均绝对误差(MAE)达到亚厘米的精度 。 许多用于车道标记检测的方法也尝试用于道路标记检测 。 它们通常使用几何和光度特征 。 此外 , 各种道路标线检测与识别方法都采用了逆透视映射(IPM) , 降低了透视效果 , 从而使问题更容易求解 , 提高了结果的准确性 。 最近 , 一些方法使用最大稳定极值区域(MSER)来检测感兴趣区域(即可能包含道路标记的区域)和用于识别道路标记的卷积网络 。 在BAI17中 , 作者提出了IPM、MSER和DBSCAN相结合的算法来检测道路标线 , 并将PCANet与支持向量机或线性回归相结合进行分类 。 在单独评估分类任务时 , 它们的准确率高达99.1% , 而在同时报告检测和识别性能时 , 其准确率则降至93.1% 。 在道路标记的上下文中 , 消息通常是单独处理的 。 一些消息检测和识别方法AHM17将不同的消息视为不同的类别(即 , 它们首先检测消息在场景中的位置 , 然后识别其类别) , 而大多数方法首先识别字母 , 然后使用基于OCR的方法进行写作 。 前者通常对天气和光照条件更为敏感 , 但后者可以识别看不见的信息 。 在道路标线的设置中 , 行人过街经常被单独调查 。 大多数人行横道检测方法利用人行横道通常呈现的规则形状和黑白图案 。 因此 , 在许多实际应用中 , 这项任务被放在了有利于鲁棒行人检测器的位置 。


推荐阅读