新技术背后有哪些道德困境?
利用人脸识别技术寻找被拐儿童, 新技术背后有哪些道德困境?本文刊载于《三联生活周刊》2019年第29期 , 原文标题《AI寻亲的进步与难题》今年上半年 , 全国多个省份都传来了被拐或走失者寻亲成功的消息 , 这得益于人脸识别技术的进步 。 但在“科技向善”背后 , 如何避免新技术的负面影响是对技术使用者的巨大考验 。采访人员/王梓辉
通过新的跨年龄人脸识别技术 , 已经有一些被拐已久的儿童找到了他们的亲生父母用一张10年前的照片找到他如果一个儿童被拐卖了 , 想找回他有多难?放在当前这个遍布摄像头的环境中 , 也许希望很大;但在10年前 , 答案是残酷的 。直到2017年12月 , 公安部刑侦局副局长陈士渠还记着他几年前曾督办过的那个拐卖儿童的案子 。 主犯在2014年落网前先后拐卖了13个儿童 , 只找回来了当年拐卖的3个 , 2008~2010年拐走的10名儿童仍无下落 , 据说原因是“主犯只交代了3个 , 如果再交代第4个刑责就有可能加重到死刑” 。负责打拐的警察们不是不努力 , 他们想过不少办法 。 根据专案组自己透露的历史 , 2015年 , 他们曾联系了著名刑事相貌专家、中国刑警学院的赵成文教授 , 依照孩子们的童年照片 , 画出他们十几岁的样子 , 专案组再带着这些画像到儿童们被卖去的广东省 , 提取适龄儿童照片 , “用肉眼找出觉得和这个像的” 。 看了10天 , 专案组带回了300余份疑似照片 , 组织家长辨认 , 最终确定了176个疑似对象 , 但最终无一命中 。 他们还曾经用肉眼尝试从十几万张可能的照片中拿走失儿童的照片进行比对 , 就那么一张一张看 , 还是没能找出来 。 而这就是传统寻找被拐儿童的方法 。这也让汤海鹏在2017年12月听到这个案子后提了一嘴 , 说腾讯正在做一些跨年龄人脸识别的算法 , 也许可以试试 。 当时陈士渠正在腾讯调研 , 而汤海鹏是腾讯安全管理部安全专家 。 就这样 , 在对话发生千里之外的广东 , 笼罩在10名被拐儿童身边的迷雾终于被撕开了一道缝 。但事情没有汤海鹏想得那么容易 。 简单来说 , 人脸识别技术指的是通过比较人脸的视觉特征信息从而进行身份鉴别的技术 。 但我们手机上用到的人脸识别技术应用难度没那么大 , 因为它识别的对象就是当下的你 , 你的脸部特征不会在短时间内发生剧烈变化 。 而跨年龄的人脸识别就要难得多 , 特别是青少年阶段 , 人脸特征变化最大 , 许多人长大后回看自己小时候的照片都认不出来 。拿到这个项目之后 , 汤海鹏回来和腾讯内部负责图像识别技术研发的优图团队交流 , 他才发现出了很大的问题 , 因为他们当时根本就不具备这个能力 。 “当时我们可能也就能够做到在几百张成人照片中间 , 通过一张婴儿时期的照片找出一个人 。 ”汤海鹏对本刊说 。 而这种能力显然无法满足在几十万张照片中找到一个人的需求 。事后回忆起来 , 其实也只有一线希望 。 但因为这个项目的特殊性 , 他们决定尽最大努力试试 。 办法只有一个 。 “就是要让机器知道 , 当一个人的面部随年龄演变时 , 不变的那些量是什么 。 ”研究员晓程说 。 然后他们再把这些面部特征转化为对应的计算机语言 。具体来说 , 这个由十几位博士组成的团队自己研发出了一套算法 , 对0~18岁的人脸成长变化进行了模拟建模 , 生成可供学习的人脸样本 , 然后利用深度神经网络算法让机器来学习这些人脸在成长过程中的变化 。 学习的材料不好找 , 就用研发人员自己小时候不同时期的照片 , 分别告诉计算机 , “这是一个人1岁的样子、5岁的样子、10岁的样子、20岁的样子” 。还好计算机技术的进步一般是指数型的 。 2018年3月 , AI比对的成功率提升到了可以一试的程度 , 第一次比对的时刻也来了 。 但没有预想到的问题出现了 。 “一开始 , 我们拿到的照片其实是家长自己用手机翻拍的那种 , 我们拿过来发现信息量损失非常大 , 根本没办法用 。 ”汤海鹏回忆说 。 只好又跟四川警方商量 , 说能不能让这一部分家长把原片送过来 , 没想到这个过程又挣扎了几周 。汤海鹏说 , 很多家长是不愿意送原片的 , 因为这么多年过去了 , 那一张照片可能是他们唯一留下来的孩子的物品 , 可能没有其他任何的能够留下来的东西了 , 而且这些照片又是分布在四川好几个地市不同的家长手上 。 但没办法 , 警方也只能硬着头皮去劝说家长们能够把照片提供过来 。 汤海鹏现在还记得一个细节 , 当四川警方收集完了照片 , 统一拿到上海漕河泾开发区软件园的优图实验室里时 , 他们慢慢打开袋子 , 看到的是好几个油纸包裹 , 把油纸一层一层地拆开 , 里面才是那一张小小的照片 。 他们再用数字化高清仪器将照片提取出来 , 每张照片的大小能从之前的几百KB变成10MB , 终于让对比有了可行性 。2018年4月 , 在由警方提供的房间里 , 优图团队的研究人员把那10张照片放到广东省方面提供的数据库里开始检测 。 两个小时后 , 电脑上生成了10个文件夹压缩包 , 每个文件夹里有101张照片 。 第一张照片是被拐儿童的原照片 , 剩下的100张照片是100个十二三岁左右的儿童 , 他们以满分100分制降序排列 , 分数基本都在75分以上 。 “75分是万分之一阈值 , 80分是十万分之一阈值 , 85分是百万分之一阈值” , 汤海鹏说 , “以75分为例 , 如果两个人脸比对分数超过75 , 则这两个人脸是万里挑一的像” 。这1000张照片被交给了四川警方 , 警方又找来家长一张张去看 , 看他们觉得哪个像 , 这样再删选到几十个;最终经过信息筛查 , 范围被缩小到了10张以内 , 而这个过程用了4个月的时间 。 最后一个环节就是比对DNA , 据说在四川省公安厅 , 参与打拐的警察们都充满期待 , 有人很乐观 , 猜测可能会比对上几个;一个干了多年警察的老刑侦比较保守 , 猜两个 。 “我们当时都在祈祷 , 觉得如果能找到一个就已经很谢天谢地了 。 ”汤海鹏说 。 最后的结果是比对上了4个 。
推荐阅读
- 6万家庭争“抢”900多套房,背后到底有没有故事
- 历史的背后|劣迹斑斑的他在狱中收到妻子来信,出狱后疯狂残杀20人,冷血恶魔
- 美国暴动背后的猜测
- 红星新闻 官宣!成都TOD“十大消费场景”首次曝光,有哪些惊喜值得期待?
- 界面新闻 民法典全文公布,与草案相比主要做了哪些修改?
- 人民币汇率短期大幅波动,背后意味什么?
- 安史之乱背后的唐朝经济
- 埃尔南德斯|一群蒙面人焚烧美国大使馆,背后或有大人物指使,警察都袖手旁观
- 听陕西|一男子从桥上跳下,背后的原因竟然是······
- 6亿人均收入1000元背后延伸的可能