“AI的商业化路线已经清晰” 2023京东“赶考”千亿级产业大模型

每经采访人员:王郁彪    每经编辑:刘雪梅
2023年的春天,AI迫不及待地“破土”了 。
英伟达创始人黄仁勋说,我们正处于AI的“iphone时刻” 。言语间,难掩兴奋 。根据瑞银分析,ChatGPT使用了约1万颗英伟达GPU来训练AI模型 。而外界普遍预计,ChatGPT的商业化将需要应用超过3万颗 。
此岸彼岸,AI持续澎湃 。即便入局的门槛如此之高,大模型的应用与尝试,却还是像颗陨石一样溅落大洋,激起阵阵涟漪 。
“AI引发新一轮生产力革命,主要源自多方面的进步 。”京东集团副总裁、京东科技智能服务与产品部负责人何晓冬博士在接受《每日经济新闻》采访人员采访时表示,“包括硬件、摩尔定律和GPU等的进步,算力提升、数据迅速增加,还有像Transformer这样的模型结构的发明 。”
两年前,何晓冬在接受采访人员采访时曾预判,“未来5年是AI落地产业化窗口期” 。如今仅过去三年时间,新的想象便提前降临 。5月6日,被誉为“中国智能科技最高奖”的吴文俊人工智能科学技术奖颁发,京东云旗下的言犀团队凭借“任务型智能对话交互关键技术及大规模产业应用”斩获科技进步奖,何晓冬获吴文俊人工智能科学技术奖杰出贡献奖 。

“AI的商业化路线已经清晰” 2023京东“赶考”千亿级产业大模型

文章插图
言犀团队“任务型智能对话交互关键技术及大规模产业应用”获得吴文俊人工智能科学技术奖科技进步奖 。图片来源:企业供图
“今年的规划是要发布面向产业的言犀大模型,预计参数量千亿级,会在京东内部生态落地实践后再对外开放 。”何晓冬透露 。京东做的是生长在数智供应链上的产业AI,和所有人一道,共赴这场AI在春日的圆梦 。
人机对话70年飞跃:从ELIZA到ChatGPT
新一轮AI革命的热潮由ChatGPT开启,就像是一场命运的定数 。因为人工智能魔方的开启,也要从人机对话说起 。
1950年,图灵发表了一篇划时代的论文,文中预言了创造出具有真正智能的机器的可能性 。由于注意到“智能”这一概念难以确切定义,他提出了著名的“图灵测试”(注:如果一台机器能够与人类展开对话而不能被辨别出其机器身份,那么称这台机器具有智能 。)
【“AI的商业化路线已经清晰” 2023京东“赶考”千亿级产业大模型】受“图灵测试”启发,16年后,1966年,美国麻省理工学院人工智能实验室的约瑟夫·维森鲍姆等人开发了最早的人机对话机器人ELIZA,关于聊天机器人的新时代就此来临 。
但当时的ELIZA只是简单模仿人的行为,谈不上智能 。到上世纪90年代,人机对话才进入了一个新的发展阶段,大家开始讨论怎么让计算机理解人类意图与执行命令 。
采访人员注意到,2012年以来,苹果的Siri、谷歌的google Assistant、微软小冰、亚马逊的Alexa等为代表的智能对话机器人走进“寻常百姓家” 。这些机器人不但能完成人下达的任务,还能逐渐跟用户建立情感上的联系 。
而伴随人机对话交互技术的成功应用,其也逐渐成为整个AI赛道绝对炙手可热的领域 。
何晓冬从技术演进的角度回顾ChatGPT时表示,这几十年走过了一个比较长的周期,但在最近几年,迎来了爆发式增长 。
“上个世纪50年代是基于规则,80年代是基于统计模型,到了本世纪深度学习崛起以后,开始向神经网络、替代模型崛起 。特别是到了2017年Google的Transformer发表以后,之后又分出了一个系列,直到今天的GPT4 。”何晓冬如此解释 。
的确,在过去近10年时间里,人工智能模型经历了从小模型到以Transformer为代表的大模型的转变 。
而指数级的增长,速度与规模的递进,更令人震惊 。“三年前说大模型,这个‘大’是10亿级别的,现在则已经升至千亿级别 。三年之内,关于大模型大的定义已经涨了100倍 。”何晓冬表示 。
多模态大模型将至 “AI的商业化路线已经清晰”
智能对话技术在过去70年有了巨大的飞跃,从“图灵测试”提出的设想,最后变成了一个真正的产品 。
原因何在?何晓冬认为,过去往往是静态数据,都是小规模人工标注的 。现在则是在特别复杂的交互场景下的动态数据,如ChatGPT过去四个月积累的数据 。此外,过去更加关注单点算法和AI组件,现在则更加关注综合性AI系统、产品生态,以及关注技术能结合什么场景实现大规模落地 。


推荐阅读