人工智能|谁能训练人工智能?

_原题为 谁能训练人工智能?
最近 , 人社部公布了一批新职业 , 其中有个新职业叫做“人工智能训练师” 。 听起来满是高科技的人工智能还要靠人来训练?谁能训练这些看不见、摸不着的人工智能?“人工智能训练师”究竟做些啥?关键是 , 挣得多不多?
带着这些问题 , 近日采访人员走访了百度(山西)人工智能基础数据产业基地 。 这里是目前国内从业人员和产值规模第一的单体数据标注基地 , 入驻企业35家 , AI数据标注师从业人员超过2300人 。
“我是数据标注员 , 中专学历 , 一天工作8小时 , 大概能挣300多元 。 ”面对采访人员的问题 , 山西麟诺网络科技有限公司的李宇龙很自豪地给出了答案 。 这个收入对一个在太原生活的年轻人来说算高水平了——数据显示 , 2019年 , 太原市的城镇居民人均可支配收入36362元 。 不过 , 李宇龙说自己不算最高的 , “我同事有一天能挣1000多元的 。 ”
李宇龙学历不高 , 原先的工作跟人工智能没什么关系 。 2018年 , 山西麟诺网络科技有限公司成立 , 李宇龙经朋友介绍来到了这家公司 。
“当时我也不知道数据标注员是做啥的 , 更没听说过人工智能 。 我们老板就交给我一套规则 , 让我按照规则在电脑上认车道线 。 ”那会李宇龙刚20出头 , 正是肯学的时候 , 他在短时间内熟悉了规则 , 还总结出了标注车道的新规律 。
作为这项新职业里的老员工 , 李宇龙目前已经转型培训师 , 除了日常工作 , 也承担起对公司新员工的培训教学 , “还有的同事会转型做项目 , 或者内容审核员 , 上升空间还是有的 。 ”
人工智能|谁能训练人工智能?
文章图片

(中专学历的李宇龙是山西麟诺网络科技有限公司的数据标注员 , 一天工作8小时 , 大概能挣300多元 。 除了日常工作 , 他也承担公司的培训业务 。 )
“数据标注技术门槛低 , 招工人群范围广泛 , 对于促进就业作用显著 。 ”山西麟诺网络科技有限公司负责人李应维告诉采访人员 , 目前公司招聘的员工以大专生为主 , 也有部分中专生 。 标注的规则由百度和相关领域的专家共同制定 , 并形成可操作的软件平台提供给企业 , 企业对员工进行简单培训就能上手 。 以人脸为例 , 目前能实现对约150个特征点的标注 。 大致的标注规则是数据标注师看到双眼皮就标记双眼皮 , 看到狮子鼻就标记狮子鼻 , 让机器自己去理解和学习 。 标注的特征点越多 , AI就越能精确地识别人脸 。
看似简单的工作 , 背后有庞大的数据基础做支持 。 算法、算力和数据是人工智能发展的三大要素 , 数据就是人工智能发展的燃料 。 每天人类社会产生的海量数据必须经过清洗和标注 , 换成人工智能熟悉的语言才有价值 。 因此 , 人工智能训练师的主要任务就是数据采集和标注 。 特别是数据标注 。 如果说人工智能是个孩子 , 那数据标注师就是带领这个孩子认识世界的启蒙老师 , 是他们一点点教会AI认识世间万物、分辨喜怒哀乐、听懂嬉笑怒骂 。 有了足够多、足够好的数据 , AI才能学会像人一样去感知、思考和决策 , 更好地为人类服务 。
人工智能产业发展之初 , 数据采集和标注需要人力完成的部分比较多 , 但现在技术相对成熟 , 数据平台已经有了持续学习能力 , 大部分采集和标注工作人工智能自己就可以完成 , 实现预标注和自动标注 , 所以现在的数据标注工作以机器辅助和人工标注结合为主 。 除了眼底检查片、肺部X光片等技术含量较高的有专业要求 , 大多数员工都能按照规则 , 在平台上完成语音、人脸、道路的标注操作 , 只要能熟练操作电脑就能胜任 。
34岁的郭梅就是新职业的受益者 。 她原本在山西一家煤矿做监控员 , 因为孩子到太原上学 , 她跟过来照顾孩子 , 到学校附近的数据标注基地求职 。 经过公司的岗前培训和团队的帮助 , 她从一开始每天只能标注两三百张 , 提升到每天能完成1300多张 。
人工智能|谁能训练人工智能?
文章图片

(34岁的郭梅原本在山西一家煤矿做监控员 , 经过公司的岗前培训和团队的帮助 , 她也成为一名数据标注员 , 孩子也在基地的帮助下 , 进入了附近一所优质学校读书 。 )
数据标注员的工作跟着人工智能的发展需求不断调整 。 前几年人工智能刚发展的时候 , 语音识别、人脸、图像等识别需求大;近几年无人驾驶、进入发展快车道 , 郭梅和李宇龙的主要工作就改成了无人车、地图、3D点云等数据标注 , 天天看的是车道线、行人、障碍物 。
“也还有一些垂类的语音识别项目 , 比如普通话的语音识别基本解决了 , 现在有的公司开始开发方言的语音识别 , 我们也接了一些方言的语音数据标注项目 , 但那些就要招聘当地人来完成了 。 ”李应维说 。
有了足够的技术基础 , 数据标注员还能教会人工智能新任务 。 疫情期间 , 戴着口罩的人脸识别需求激增 。 “根据客户需求 , 山西数据标注基地采集了大量戴口罩的人脸照片 , 由数据标注师对人脸的眉毛、眼镜、颧骨等人脸关键点进行精准标注 , 训练人工智能完成了戴口罩的人脸图像识别 。”百度(山西)人工智能基础数据产业基地负责人尉赤说 , “人们能在不摘口罩的情况下实现精确的体温测量 , 或是通过人脸闸机 , 背后就是这些数据标注员在训练人工智能 。 ”


推荐阅读