世界上最优秀的工业机器人配上最优秀的软件团队,能否在球类运动中击败世界冠军

经过证实,这支视频是经过剪辑的商业宣传片,即广告。《The Wire》上有说明http://www.thewire.com/technology/2014/03/epic-man-v-machine-battle-ping-pong-supremacy-was-huge-letdown/359043/。虽然如此,我还是想回答看看这个问题。为了简化问题,我把球类运动缩小到足球上。工业机器人从定位精度、功率上目前已经超过人力了。定位精度的比较。如果要求人的手拿根针,在面包上扎洞洞,以我个人这几年在显微镜下工作的功力(实验室公认的“不抖手”),能够达到0.1mm这个数量级的定位精度。我估计专业狙击手的精度应该和我在一个数量级,只是误差小一些而已。普通人的手一般受神经回路的噪声(这是我猜的,请学医的补充)或者心脏跳动引起的血流影响,定位精度只能到1mm数量级。但工业机器人的机构以精密机械加工技术为基础,定位精度普遍能到0.01mm这个数量级。功率的话,据吉尼斯纪录记载,大力士能够举的重量是1030公斤(1吨啊,这人吃什么的,想不通)。KUKA的大功率机器人与之略有胜出。但是要知道,机器人可以举着1吨的东西按照编程的轨迹运动,精度在1mm左右(数据可能有误,再修改);大力士的话,应该就是举起来然后放下吧,没有精度可言。所以,就比肌肉而言,机器人是完胜的(这后面肯定有"但是")。但是1,工业机器人的传感技术远落后于人体。但是2,工业机器人目前的移动性很差。----------------------------------------------------------传感技术-----------------------------------------------------------------传感技术的话,话题太大了,我尽量把握,也请大家补充。首先,我个人的观点是,工业传感技术的科技树和人体传感的科技树截然不同。形象比喻的话,前者比后者要纷繁复杂得多,前者可以看着苍天大树,但是多有枝干,叶片还不足,这棵树也有歪脖子倾向,发展不平衡;后者虽然是棵绿萝,但是完整、优美。但就传感器种类而言,前者比后者至少高出2个数量级,检测量也宽泛许多。后者,人体传感技术就5个量:视、声、嗅、味、触。但是这5个量却能保罗万象,有点“一生二、二生三、三生万物”的意思。工业传感的科技树,类比起来,过去的几十年主要在发展进化人体的“触”这一感,譬如温度计(人识别温度靠手背试温)、压力计(用手指堵住水龙头感觉水压、或淋浴的时候水柱打在身上)、接近传感器(也可归为视觉,但是触觉精度更高,譬如练拳击时陪练的手靶在被触及时更换位置)、表面光洁度检测(手能摸出镜子与砂纸之间的表面区别)等等。基本上工业检测的力学与热学物理量都是人体触觉的定量延伸,当然光学测应力或者非接触测温在原理上都是视而不是触,主要是机械精度到达了边际。目前,工业现场用得最多的传感器都可以归到对人体触觉的延伸。重点来了。就触觉来说,就“点”精度,工业技术高出人体很多数量级,虽然屠户老手颠颠肉知道斤两,但是却远不及天平秤的小数点位数多。就“场”而言,人类自身的传感水平要高明许多,工业界常常有些玄而又玄的说法,譬如半导体行业用的光刻机中,大型透镜加工的最后一步,居然是靠几十年的老师傅徒手打磨;场的另一个例子是,在桌上撒一把沙子,人手往沙上一按,大概对沙堆的形状能够知道个八九不离十,如果不借助光学方法,采用电子皮肤(橡胶类)或者光纤皮肤,对沙子“形状场”的量化精度要差人手很多。力学、热学类型的”触“传感器,工业”点“信号的传感能力远高于人类,其关键在换能器,不在信号处理;而工业中”场“信号的传感能力可以被人体甩出一条街,连信号都难采到就不谈什么处理能力的优劣。回到踢足球这件事上,当用踩压停球时,人足底因为有场的传感能力能够胜任;而机器人实现这一动作,着实又贵且难。脚背踢球、胸口停球、头球等,均依赖于这一技术基础。接下来说说”视“。人眼因为仅能接收可见光,因此传感环节的综合得分上工业技术完胜。传感环节上,不仅颜色(波长)、光强等特征,光学传感器没问题,而且能对付红外、紫外不可见光,还能对付偏振光,没有哈勃望远镜,红移这事我猜没有人肉眼能看到。但是工业机器人没什么好高兴的,因为它看得到这些特征,但是不知道有什么具体的含义,或者说,我们还没有开发出足够好的算法让它去看懂。说人类最擅长的识别物体这一功能,我家三岁的那位对于生活中的物体乃至他没见过实物的物体(书上的坦克等),均能当电视出现时该物体时说出名字。三岁孩童对图像的处理一气呵成,不讲逻辑,不假思索。但是目前架构下的计算机,对物体的识别可就大费周章了,最典型的做法是图像降噪、边缘提取、图像分割、图像匹配,而且算法鲁棒性与环境适应性堪忧。目前工业机器视觉勉强能适应工况,但是更复杂的计算机视觉一类算法都距离三岁孩童太远。再回到足球上。人类80%的信号输入都是图像,踢球时也不例外。机器人的视觉处理算法水平总体还太低,不过,踢球时只需要球的物体时别和位置信息,这个还是能做到的,只是希望看台观众不要时不时来个人浪、挥舞个旗子什么的施加太多干扰。而且踢球用的视觉系统,最经济高效的不是每台机器人布置一套双目视觉,应该是场边布置高速摄像机,配服务器做运算,得到球的坐标及速度、加速度等信号后下发给各个机器人。既然把五感提了,虽然 听、嗅、味和踢球关系不大,因为听可以用电信号通讯取代,嗅和味的话,很明显,不需要机器人闻闻绿茵香或鲁尼汗臭,更不用咬一口尝尝味道吧?但是既然说了,也一并聊聊。听的能力,建议用用Apple的Siri就知道;嗅的话,工业界的做法是为每一种气体分子开发一种分析仪,当然也有色谱一类的综合型产品,但要装在有移动能力的机器人身上基本不可能,实时性也不够;味的话如同嗅一样。嗅与味二者的瓶颈也是在换能器,因此也不提信号处理的比较了。综合上述传感技术,我们的机器人能够准确知道球在哪儿,往哪儿滚,滚多快;但是球到机器人脚下了,踢的方向主要靠踢球的位置来弥补,停球、带球这些事情可能比较困难。-------------------------------------------------移动性-------------------------------------------------------------------------------上面废话了那么多,其实机器人能不能踢赢,关键还是移动性问题。这像在讨论一群超级大力士是否足够灵活完成体操。首先假设,机器人是人形设计,即双足+躯干+双臂。人形机器人目前已经达到了Will Smith主演的《I, Robot》里Sonny的能力了,见下图。看,他很娴熟地眨眼睛。其他能力具体可以看看电影。世界上最优秀的工业机器人配上最优秀的软件团队,能否在球类运动中击败世界冠军


推荐阅读