人工智能训练师究竟做些啥 挣得多不多?

谁能训练人工智能
本报采访人员 佘 颖
最近 , 人社部公布了一批新职业 , 其中有个新职业叫作“人工智能训练师” 。 听起来高大上的人工智能还要人来训练?谁能训练这些看不见、摸不着的人工智能?“人工智能训练师”究竟做些啥?关键是 , 挣得多不多?
带着这些问题 , 经济日报采访人员近日走访了百度(山西)人工智能基础数据产业基地 。 这里是目前国内从业人员与产值规模第一的单体数据标注基地 , 入驻企业35家 , AI数据标注师从业人员超过2300人 。
“我是数据标注员 , 中专学历 , 每天工作8小时 , 大概能挣300多元 。 ”面对采访人员的问题 , 山西麟诺网络科技有限公司的李宇龙自豪地给出了答案 。 这个收入对在太原生活的年轻人来说算高水平了——数据显示 , 2019年 , 太原市城镇居民人均可支配收入36362元 。 不过 , 李宇龙说自己不算最高的 , “我有的同事一天能挣1000多元” 。
李宇龙学历不高 , 原本与人工智能没什么关系 。 2018年 , 山西麟诺网络科技有限公司成立 , 李宇龙经朋友介绍来到这家公司 。
“当时我也不知道数据标注员是做啥的 , 更没听说过人工智能 。 老板就交给我一套规则 , 让我按照规则在电脑上认车道线 。 ”那时20岁出头的李宇龙正是肯学的时候 , 短时间内就熟悉了规则 , 还总结出标注车道的新规律 。
作为这项新职业的老员工 , 李宇龙已转型培训师 , 除了日常工作 , 还承担起公司新员工的培训教学 , “有的同事会转型做项目或者内容审核员 , 还是有上升空间的” 。
“数据标注技术门槛低 , 招工人群范围广泛 , 对于促进就业作用显著 。 ”山西麟诺网络科技有限公司负责人李应维告诉采访人员 , 目前公司招聘的员工以大专生为主;标注规则由百度与相关领域专家共同制定 , 并形成可操作软件平台提供给企业 , 对员工简单培训就能上手 。 以人脸为例 , 目前他们能实现对约150个特征点的标注 。 大致标注规则是数据标注师看到双眼皮就标记双眼皮 , 看到狮子鼻就标记狮子鼻 , 让机器自己理解与学习 。 标注特征点越多 , AI就越能精确识别人脸 。
看似简单的工作 , 背后是庞大数据基础做支持 。 算法、算力与数据是人工智能发展的三大要素 , 其中数据是人工智能发展的燃料 。 每天 , 人类社会产生的海量数据必须经过清洗与标注 , 换成人工智能熟悉的语言才有价值 。 因此 , 人工智能训练师主要任务就是数据采集和标注 , 特别是数据标注 。 如果说人工智能是个孩子 , 数据标注师就是带领这个孩子认识世界的启蒙老师 。 有了足够多、足够好的数据 , AI才能学会像人一样去感知、思考和决策 , 更好地为人类服务 。
【人工智能训练师究竟做些啥 挣得多不多?】人工智能产业发展之初 , 数据采集与标注需要人力完成的部分比较多 , 现在数据平台已有了持续学习能力 , 大部分采集与标注工作人工智能自己就可完成 , 实现预标注与自动标注 。 因此 , 目前数据标注工作以机器辅助与人工标注结合为主 。 除了眼底检查片、肺部X光片等技术含量较高有专业要求 , 大多数员工均能按照规则 , 在平台上完成语音、人脸、道路的标注操作 , 只要能熟练操作电脑即可 。
郭梅是新职业的受益者 。 34岁的她原本在山西一家煤矿做监控员 , 为照顾到太原上学的孩子 , 她到学校附近的数据标注基地求职 。 经过公司岗前培训与团队帮助 , 她从起初每天标注两三百张图 , 提升到每天能完成1300多张 。
数据标注员的工作随着人工智能发展需求不断调整 。 前几年人工智能发展伊始 , 语音识别、人脸、图像等识别需求大;近几年无人驾驶进入发展快车道 , 郭梅与李宇龙的主要工作就改成无人车、地图、3D点云等数据标注 , 天天看的是车道线、行人、障碍物 。
“还有一些语音识别项目 , 比如我们接了一些方言语音数据标注项目 , 这就需要招聘当地人来完成了 。 ”李应维说 。


推荐阅读