机器人|视觉语言导航:造就高智商机器人


北京联盟_本文原题:视觉语言导航:造就高智商机器人
机器人|视觉语言导航:造就高智商机器人
本文插图

视觉语言导航技术的发展 , 让人工智能离“像人类一样”更近了一步 。
有专家这样说 , 人类开发人工智能的未来目标 , 如同现在科幻电影所呈现的场景一样 , 智能机器可以独立“看、听、思、行” , 具备像人类一样的语言理解系统、视觉感知系统、自我理解与行动的能力 , 最终成为人类的完美“替身” 。
如今 , 世界科技飞速发展 , 视觉语言导航技术日臻成熟 , 高智商的机器人正向我们走来 。
视觉语言导航 , 指的是让智能体跟着自然语言指令进行导航 , 同时理解指令与视角中可以看见的图像信息 , 然后在环境中对自身所处状态加以调整、修复 , 做出对应的动作 , 最终到达目标位置 。 比如 , 我们把机器人放置在一间卧室里 , 让它去取放在另一间卧室里的足球 。 因为房间无法通视 , 机器人需要走出房间 , 经过走廊、客厅等场所 , 并通过推算看到的每一处环境信息 , 来判定下一步行进方向 , 最终定位找到足球 。
由此可见 , 视觉语言导航涉及计算机视觉、自然语言处理和自主学习三大核心技术 。
先进的科技成果往往备受军事领域的青睐 。 世界许多国家已开始致力于视觉语言导航在人工智能上的拓展运用 , 打造智能战争机器 , 抢占打赢明天战争的前沿高地 。
计算机视觉 , 让智能机器“看清”世界
计算机视觉是一个跨领域的交叉学科 , 包括计算机科学、数学、工程学、物理学、生物学和心理学等 。
在人工智能里 , 计算机视觉可以类比人类的眼睛 , 是在感知层上最为重要的核心技术之一 。 它能让智能机器人灵敏地辨识“眼”前的一切 , 并对捕捉到的图像数据信息进行分析识别、检测、跟踪等 。 嵌入计算机视觉技术的智能武器 , 可以通过视觉系统 , 精准辨识和区分目标的主次、真伪 , 大大提升作战效率 。
据悉 , 现在技术人员读取由无人机传回的战场态势数据 , 每天的工作时间要超过10个小时 。 这与瞬息万变的未来战场不相适应 。 然而 , 当计算机视觉技术应用于战场智能侦察装备前端时 , 可从海量信息中有效过滤无关信息 , 向作战人员提供甄别处理后的视觉态势图 , 指挥决策效率随之提升 。
当前 , 世界发达国家的部分装备已经开始应用该项技术 。 如美军搭载计算机视觉技术的iRobot侦察机器人 , 就是其中之一 。 它可以警告作战人员有伏击或其他危险 , 经过处理的态势感知 , 能够明确指出目标坐标 , 或提示危险等级 。 该侦察机器人还可准确传回有价值的态势视频与相关建议指令 , 缩短己方在战场上的决策周期 , 从而把握行动优势 。
近年来 , 俄军也在大力开发人工智能系统 。 其自主研制的陆战机器人 , 可在遥控下完成巡逻、侦察、追踪、阻截、攻击等任务;形似军犬、快速奔跑的机器人 , 可供火线运输弹药给养;铲车式机器人 , 可将战场上的伤员用铲斗送回后方等 。 俄军部分导弹也已装有人工智能设备 , 在导弹飞向预定目标时 , 若人工智能设备在途中甄别出价值更大的目标 , 导弹可自动转向进行攻击 。 在这些先进的武器中 , 都能看到计算机视觉的影子 。
在民用领域 , 计算机视觉技术已陆续应用到安防、自动驾驶、医疗、消费等活动中 。 这也是当前人工智能细分领域中发展最快、应用最广、炙手可热的技术之一 。
随着算法的更迭、硬件算力的升级、数据的大爆发 , 以及5G带来的高速网络 , 无论在民用领域还是军用领域 , 计算机视觉技术的应用将会有更大的空间 。
自然语言处理 , 让智能机器“听懂”指令
简单地说 , 自然语言处理就是用计算机来处理、理解以及运用人类语言(如中文、英文等) , 它属于人工智能的一个分支 , 是计算机科学与语言学的交叉学科 , 又常被称为计算语言学 。


推荐阅读