伍大勇为机器注入智慧力量(经济聚焦·新职业看新需求③)

伍大勇为机器注入智慧力量(经济聚焦·新职业看新需求③)
文章图片

数据来源:中国互联网络信息中心
制图:张丹峰
日前,人社部等部门向社会发布“区块链工程技术人员”“互联网营销师”等9个新职业,这是我国自《中华人民共和国职业分类大典(2015年版)》颁布以来发布的第三批新职业 。
随着我国经济转型升级的推进,人工智能、物联网、区块链等新兴技术在多领域运用,与之相关的新职业应运而生,人工智能工程技术人员便是其一 。用户在手机上简单的一键式操作,背后凝聚了人工智能工程技术人员的复杂劳动 。他们在每天和机器的对话中,用更精准的模型,让机器更通人性,也让工作与生活变得更加智慧 。
——编 者
一台轻薄的笔记本电脑,一部高清的大屏幕显示器,一叠码放整齐的纸张,再加一支随意放着的笔……上午8点,伍大勇早早来到办公室,简洁而工整的案头跃入眼帘 。
“瞧,这就是我们日常工作的‘标配’,绝大多数时间在跟机器打交道 。”保温杯里泡好茶,伍大勇打开电脑,“我们的工作,一句话总结,就是用算法操控机器学习 。”说话间,伍大勇脖子上挂着的工牌来回晃动,上面印着:科大讯飞人工智能高级工程师 。
设计模型,和机器对话
“老板拖欠工人工资不讲诚信,我能要求赔偿吗?”
“根据劳动争议调解仲裁法规定,用人单位违反国家规定,拖欠或者未足额支付劳动报酬,劳动者可以向劳动行政部门投诉,劳动行政部门应当依法处理 。”
如何与机器实现这样的对话?前阵子,伍大勇收到来自公司的最新任务,公司正在参与研发法律智能问答小程序“民法知道”,任务要求:打开微信小程序,语音输入感兴趣的法律问题,后台自动问答机器人能迅速匹配出对应法律条文,并给出咨询建议 。
用户在手机上简单一键式操作,背后是人工智能工程师的复杂工序 。接到任务后,伍大勇抽出几张纸放在面前,开始构思模型,奋笔疾书 。
一个多小时后,白纸上已被勾画得满满当当 。“要让机器听话,首先要能和机器对话,这就要把问答任务转化为机器能处理的算法 。”
在伍大勇的图纸上,任务已被清晰地分成三类算法:文本表示算法,为了把问题变成机器能看懂的语言;分类算法,用来解决哪个领域的法律能够适用用户提出的问题;文本匹配算法,用来解决具体法条的对应问题 。
上午10点多,伍大勇整理了一下稍显凌乱的案头,看了一眼梳理好的思路,长舒一口气:“‘地基’算是打好了,如果不能很好地转化为机器算法,后续搭起来的程序就难以实现需要的功能 。”
短暂起身站了一会儿,伍大勇继续伏坐案边 。基本思路敲定,他打开公司网上工作平台,联系数据资源部的同事拿到准备好的数据 。“模型设计好后,要在网上大量搜集网友们的各种真实法律问题,并将已有回答中对应的法律法条逐条标注出来,‘投喂’给机器,让它根据算法学习解读一问一答中包含的对应关系 。下午将是一场‘重头戏’ 。”
优化算法,提高精准度
下午1点半左右,下楼吃完午餐,伍大勇匆忙回到办公室,抓紧时间把上午写在纸上的算法模型敲成电脑里的一行行代码 。
“这一步是关键 。”伍大勇坐下后,一边紧张地飞速敲代码,一边告诉采访人员,“别看这个功能用起来简便,得敲几百行,今天下午怕是弄不完 。”
在“吧嗒吧嗒”的敲击键盘声中,3个多小时飞逝而过 。伍大勇抬手一看,将近下午5点,转头看电脑屏幕,任务完成了一半多 。他指着程序里密密麻麻的字符串介绍,“开头一段代码在定义问答中涉及的各种问题变量,接下来是调用各种算法,让机器一步步学习问答之间的逻辑关系 。”
“今天完成的部分还不是人工智能工程师的全部,我个人的工作也只是人工智能浩繁领域中的一小部分 。”伍大勇说,写完模型构建的代码后,要导入之前准备好的数据,在机房里大规模服务器上进行模型训练 。其间,往往是漫长的等待,有时候训练过程要好几天 。


推荐阅读