计算机视觉研究新趋势:下一次突破会是什么?

译者 | 布加迪
20世纪50年代的计算机视觉首批用例可以分析键入文本和手写文本 。早期的商业应用程序致力于单个图像,包括光学字符识别、图像分割和对象检测 。人脸识别方面的开创性工作始于20世纪60年代,科技巨头们在2010年左右开始推出相关功能 。

计算机视觉研究新趋势:下一次突破会是什么?

文章插图
计算机视觉市场规模在2022年估计为140亿美元,预计从2023年到2030年将以19.6%的年复合增长率增长 。虽然有许多新的计算机视觉突破和初创公司,但与其他人工智能技术相比,市场规模还是很小 。比如说,到2032年,生成式人工智能的市场规模估计将达到1.3万亿美元 。
计算机视觉的新兴用例如今无论您走到哪里,摄像头都可能在扫描您 , 计算机视觉算法执行实时分析 。计算机视觉的主要用例包括文档扫描、视频监控、医疗成像和交通流量检测 。实时计算机视觉方面的突破促进了自动驾驶汽车的发展 , 并推动了无收银员商店和库存管理等零售用例的发展 。
您可能碰到过或读到过诸如此类的面向消费者的用例,特别是汽车和消费者市场中的计算机视觉主要应用 。
您可能不太了解制造业、建筑业及其他工业企业在如何使用计算机视觉技术 。这些行业的企业通常迟迟不愿投入于技术,但制造、数字建筑和智能农业等行业的工业4.0计划正在帮助行业领导者更好地了解新兴技术带来的机遇 。
减少制造过程中的浪费计算机视觉在制造业带来了重大的机会,计算机视觉算法达到了99%的准确率 。考虑到只有10%的公司使用这项技术,这方面的潜力尤其惊人 。工业领域正在酝酿一场数字革命,还是这些企业在采用计算机视觉技术方面继续落后?
IndustrialML首席执行官Arjun Chandar表示,在制造业中,识别动态材料的产品质量是主要的用例 。“借助高帧率的相机和逐帧运用机器学习模型,就可以快速识别生产线上的瑕疵 。”
全球制造商每年浪费高达8万亿美元 , 计算机视觉可以帮助监控设备、制造部件和环境因素,从而帮助制造商减少这些损失 。
Chandar表示,许多制造业用例的底层技术是主流技术 。“这些主要使用2D相机,不过拥有高分辨率和每秒20帧或更高的帧率 , 还使用卷积神经网络(CNN) 。”
为了提高准确性,制造商需要一种策略来充实这些数据 。Chandar补充道:“要像在典型的制造环境中那样增强训练能力,具有良好产品质量的图像数量需远远超过瑕疵 。”
消除这个缺口的一种方法是使用合成数据 , 这是开发团队用来增加测试数据多样性的一种方法 。
Syntax数据管理和创新合伙人Jens Beck表示,制造商可以从基本的视觉检查步骤入手,随后寻求更大的自动化机会 。他说:“我们看到计算机视觉和人工智能结合用于视觉检查,比如在汽车上检查胶水痕迹 。对客户来说 , 商业价值不仅仅在于通过自动化手动步骤来提高整体设备有效性(OEE),还在于将检查记入文档,然后将计算机视觉集成到制造执行系统(MES)中,最终集成到企业资源规划系统(ERP)中 。”
提高工厂车间的安全性除了质量和效率外,计算机视觉还有助于提高工人的安全性,减少工厂车间及其他工作场所的事故 。据美国劳工统计局声称,2021年制造业有近40万人受伤和患病 。
Synthesis AI的首席执行官兼创始人Yashar Behzadi说:“计算机视觉可以比人员监管体系更快速更高效地不断识别员工面临的潜在风险和威胁,从而提高工人的安全性 。计算机视觉要准确可靠地做到这点,机器学习模型就要使用大量的数据进行训练;在这些特定的用例中,非结构化数据常常以原始、未标记的形式出现在机器学习工程师的面前 。”
使用合成数据对于安全相关的用例也很重要,因为制造商不太可能有着重显示潜在安全因素的图像 。Behzadi补充道:“合成数据等技术通过提供准确标记的高质量数据,减轻了机器学习工程师的压力 。这些数据可以解释极端情况,从而节省时间和金钱,并避免不准确的数据导致的棘手问题 。”
Gramener的物流和供应链SBU负责人Sunil Kardam表示:“计算机视觉的好处包括实时分析、提高效率和改进决策 。”Kardam分享了另外几个典型的用例: