多目标跟踪：监控领域你必须要了解的算法 _算法

作者：Deval Shah
编译：ronghuaiyang

导读

对监控领域的目标跟踪方法以及面临的挑战进行了一个介绍，是一个很好的了解目标跟踪领域的“是什么”和“为什么”问题的文章。

文章插图

在我们深入到目标跟踪的世界之前，我们必须理解监控世界的“为什么”和“是什么” 。全球各国都安装了数百万个摄像头，但几乎没有人监控它们。人与摄像机的比例很小。
由于深度学习技术在监控领域的广泛应用，智能软件在过去十年中接管了监控领域。复杂的问题，如人员跟踪，交通密度估计，盗窃保护等，已经被世界各地的杰出研究人员解决了，并显示了巨大的前景。
本文将向你介绍智能监控中最重要的主题之一 —— 目标跟踪。
介绍目标跟踪是指根据之前的信息估计场景中目标物体的状态。

文章插图

在high level的抽象中，主要有两个层次的物体跟踪。

单目标跟踪(SOT)
多目标跟踪(MOT)

目标跟踪不局限于二维序列数据，可以应用于三维领域。
在本文中，我们将深入研究目标跟踪范式的一个子领域，即使用深度学习的二维视频序列中的多目标跟踪(MOT) 。
深度神经网络(DNN)的强大之处在于它们能够学习丰富的表示，并从输入中提取复杂和抽象的特征。
多目标跟踪(MOT)，也称为多目标跟踪(MTT)，是一种计算机视觉任务，旨在分析视频，以识别和跟踪属于一个或多个类别的对象，如行人，汽车，动物和无生命的物体，没有任何先验的目标外观和目标数量。
在单目标跟踪中，目标的出现是预先知道的，而在多目标跟踪中，需要一个检测步骤来识别出进入或离开场景的目标。同时跟踪多个目标的主要困难来自于各种各样的遮挡以及物体之间的相互重叠，有时物体间也会有相似的外观。因此，仅仅使用SOT模型直接解决MOT问题，往往会导致较差的结果，往往会导致目标漂移和大量的ID切换错误，因为此类模型往往难以区分外观相似的类内物体。
近年来，由于深度学习方法的研究呈指数级增长，检测和跟踪方法在准确性和性能方面取得了巨大的进步。
大多数先进的跟踪方法遵循“检测跟踪”的方案，他们首先在场景中找到对象，然后找到对象对应的tracklets(它在下一帧的位置) 。
如今，这种探测器的性能异常出色，能够适应不同的场景。因此，它定义了跟踪算法的标准输入。

文章插图

还有其他的方法，比如Lucas Kanade的光流，基于排序的跟踪等，它们在传统的计算机视觉方法的基础上表现也都很出色。
挑战在解决目标跟踪问题时，会出现一些问题，这些问题会导致糟糕的结果。多年来，算法试图解决这些问题，但到目前为止，我们还没有找到一个被充分证明的解决办法，这仍然是一个开放的研究领域。