值得一提的是,黄颂希望自己的团队能招到复合型人才,既懂AI,也懂生物、化学、医药 。“AI只是一个工具,还是要落地在行业上 。”
今年7月10日,《生成式人工智能服务管理暂行办法》(以下简称“《办法》”)发布,由国家网信办联合国家发展改革委、教育部、科技部等七部门审议通过,自2023年8月15日起施行 。
《办法》内容共24条,从生成式人工智能服务提供者的算法设计与备案、训练数据、模型,到用户隐私、商业秘密的保护,监督检查和法律责任等方面提出了相关要求 。根据《办法》,提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续 。
也就是说,安全、合规是国内大模型行业的红线 。事实上,大模型有个术语叫奖励模型(RM,reward model,也叫偏好模型),即通过打分和排序的动作让模型进一步与人类的偏好对齐,避免模型产生种种迷惑行为 。
奖励模型、对齐,这就需要人工操作 。采访人员注意到,百度近日宣布,位于海口市秀英区的百度智能云(海口)人工智能基础数据产业基地正式启动运营,这是百度智能云与海口市政府合作共建的国内首个大模型数据标注中心 。
据百度官方公众号介绍,当前,大模型正处在产业落地前期,高质量的数据是大模型实现产业化的关键要素 。对于以 ChatGPT、文心一言为代表的生成式 AI工具,海量的数据训练、人工标注、指令微调、基于人类反馈的强化学习(RLHF),可以让大模型与人类价值观、思维方式不断对齐,使大模型更加好用 。
为此,百度智能云升级了大模型数据服务能力,建设了国内首个专业大模型数据标注基地 。百度称,为保障数据标注质量,百度智能云还搭建了全流程数据服务人才梯队,海口数据标注基地现拥有数百名专职大模型数据标注师,标注师的本科率达到100% 。
“有多少智能,就有多少人工 。”从某个角度看,这句在人工智能领域流传甚广的话不无道理 。百度智能云数据标注基地业务产品负责人胡驰表示,人工标注将是大模型训练中绝对无法被替代的一部分,大模型数据标注员将会是一个长期的职业 。
“比如当前被誉为最接近通用智能的大语言模型,依然离不开数据标注 。它基于大规模无标注数据进行预训练,再经过精调,在各领域中得到很好的应用 。这其中的一个重要环节,就是算法工程师需要使用高质量的、人类反馈的标注数据进行大模型精调,来帮助模型成长 。”胡驰接受采访时表示 。
【这类人才火了! 平均年薪已超30万】
推荐阅读
- 火车软卧可以充电吗 火车硬卧可以充电吗
- 火字旁的男孩名字 火字旁的男孩名字大全免费
- 刘亦菲又一新剧未播先火!获央视点名预热,阵容顶级有望再创经典
- 煮火锅直接放火锅底料吗可以吗 煮火锅直接放火锅底料吗
- 还没翻红就翻车了,这3位“哥哥”证明,有的男星不火是有原因的
- 油菜是大火炒还是小火
- 吃火锅时不能点5类蔬菜
- 2天6个大瓜!出轨、诈骗、找小三、被抓、火灾
- 梨花的养殖方法 火炬凤梨花的养殖方法
- 火车站的健康码怎么弄微信 火车站的健康码怎么弄微信二维码