传统AI时代,终将过去?


传统AI时代,终将过去?

文章插图
生成式AI掀起巨大声势,而它自身也不断展现出越来越大潜力 。比如让AI自动设计芯片,或者让AI给人看病 。
为抢占领先地位,趋之若鹜的企业不仅使出浑身解数,释放自身技术力,AI模型也越做越大,以达到力大砖飞的效果,实现智能涌现(emergence) 。
科技部新一代人工智能发展研究中心的《中国人工智能大模型地图研究报告》显示,迄今为止,中国已发布79个10亿参数规模以上的大模型,大模型之战逐渐步入后半场,更多人开始关注大模型与实体产业的结合上,企业也接连展示其产品的应用场景 。
但平心而论,原本使用传统AI技术的应用,真的需要使用大模型吗,什么样的大模型才是行业所需的?华为开发者大会2023(HDC.Cloud 2023 )上,华为云展示其在“AI for Industries”、盘古大模型方面的最新进展,并提出让AI重塑千行百业 。
行业大模型成新风向任何企业都不想在大模型热潮中掉队,你方唱罢我登场,近几个月每隔几天都会有一个大模型的新闻 。市场轮转下,企业已纷纷从抢占先机,上马通用大模型,逐渐谋局落子,转向行业大模型,尽显自家产品实用性,其中不乏实机演示和方案展示 。
大模型之所以被大众所熟知,是因为ChatGPT这样to C的产品,让人实实在在体会到技术的价值 。实际上,大模型的关键不在于有多大,或是通用能力有多强,而在于能不能解决现有应用的问题,只有立足应用本身,重塑千行百业,改善提升人们生活品质,才能被人所接受 。
纵观全球,因算力成本高昂、信息泄露、政策监管等挑战,大模型的to C商业化进程更为缓慢,大多企业选择务实地面向to B端企业客户落地,满足特定行业场景所需要求 。可以说,做行业大模型已成普遍共识 。
传统小模型AI通常只能执行特定任务或特定问题,对to B行业而言,大模型不仅可以将传统系统信息串联在一起,还可实现更为复杂的决策和规划 。
但做行业大模型谈何容易,许多想要应用AI的企业,最终都只能作罢 。
首先,企业业务场景复杂,且多数需定制化,要对文本、图片、音频、视频、机理等多样化任务进行处理,与之相悖的是,大多企业稀缺数据样本 。
其次,大模型是烧钱的游戏,不仅要在训练阶段使用千卡起步的大算力,还需技术力极高的专业AI应用开发人才 。
最后,数据和知识是企业核心资产,需保证企业数据的隐私安全及合规 。
专业的事,就应该交给专业的人来做,大模型亦如此,而不是让企业与去制造螺丝、轴承、齿轮这样的基础性工作 。
华为云作为早在2021年就发布盘古基础大模型的企业,在大模型领域绝非新手,彼时便以AI工业化为目标 。而到今天,华为云正式发布盘古3.0和昇腾AI云服务,成为中国首个全栈自主的AI大模型,坚持AI for Industries方向,让AI和各行各业深度结合 。
就如华为常务董事、华为云CEO张平安发所提到的,盘古大模型不作诗、只做事,聚焦行业场景,致力于深耕政务、金融、制造、煤矿、铁路、制药、气象等行业 。
以大代小引发的改变事实上,大模型早已脱离讲概念的阶段,而是正在悄然改变生活中的一切 。
气象与人类密不可分,而它也为我们的发展之路上带来许多损害 。就比如,每年,全球大约会生成80个台风,其中影响西北太平洋和南海的大约有25个,平均有7个会登陆我国 。2022年,台风灾害造成的直接经济损失54.2亿元 。
传统气象预测多采用HPC高性能计算机计算,如要预测台风未来10天路径,需在超级计算机上,利用超过3000个节点的超级计算机上花费数小时进行仿真 。随着算力增长趋势和物理模型复杂化,传统数值预报瓶颈凸显 。
盘古气象大模型则只需单机单卡,10秒内就可完成一次气象预测 。它是全球首个精度超过传统预报方式的AI模型,可在秒级时间内完成一个台风未来10天的路径,台风路径预测准确度世界第一,相比欧洲气象局提升约20% 。
同样的改变,发生在制药领域 。
抗生素曾挽救无数人生命,但自1987年达托霉素被发现以后,人类已有近40年没有发现新的抗生素 。耐药性不仅会威胁每个人的身体健康,还可能会导致到2030年GDP每年下降至少3.4万亿美元,使2400万人陷入极端贫困 。世界急需全新类别的抗生素,改变病人面对“超级耐药菌”感染时无药可用的局面 。
研究一款新药谈何容易,一直以来,新药研发难逃“双10定律”魔咒,即平均成本超过10亿美元、研发周期大于10年 。不止如此,这还是最佳的业态,现实中一款新药从研发到获批上市,平均需要10年~15年时间,耗费超过26亿美元,且临床成功率不到10% 。


推荐阅读