群“模”大战:打的是什么?谁更有机会?

“百模大战”开打,未来谁将脱颖而出?
在今年的世界人工智能大会上,大模型占据当仁不让的C位,国内外总计30余款大模型集体亮相,据采访人员不完全统计,其中既有来自企业巨头华为、百度、阿里、京东等推出的通用大模型,也有来自清华、复旦等学院派大模型,还有包括出门问问、第四范式等创业公司入局,“厮杀”尤为激烈 。
从起初的算法、算力,到如今的应用场景、商业空间,业界对于对大模型的争论,逐渐从方向前景向应用现实层面靠拢 。
腾讯副总裁汤道生提到了“通用大模型”和“行业大模型”两条不同路径,如何在最低成本下实现大模型的最优选择,创业公司如何在巨头裹挟中找到生存机会,成为今年产业界的热议焦点 。
入局大模型的两种范式,有多烧钱?
所谓人工智能大模型,通常指的是经过大规模数据训练后,能够适应一系列任务的模型 。
大模型的“烧钱”已成为业内共识 。此前,华为云人工智能领域首席科学家田奇曾在公开演讲中表示,大模型可能收编高度定制化的小模型,导致市场向大公司集中,其资本门槛高,大模型开发和训练一次1200万美元 。
昆仑万维此前也在公告中表示,大模型市场已经进入10家左右中大型公司,打3-5年持久战的格局,要做好这件事情,需要长期储备至少10亿美金以上的资金 。
作为行业人士,网易伏羲预训练及生成式人工智能平台负责人赵增向采访人员介绍,目前企业入局大模型主要分为两种范式:第一种是着力于通用能力的基础大模型,这也是成本最高、最为昂贵的大模型 。另一种则是基于基础大模型的行业垂直大模型,以大部分创业公司为例 。
基础大模型以国外的AI target=_blank class=infotextkey>OpenAI,国内的阿里、百度等为例,据浙商证券分析师陈杭此前发布报告,一片英伟达顶级GPU成本为8万元,GPU服务器成本通常超过40万元,“对于ChatGPT而言,支撑其算力基础设施至少需要上万颗英伟达GPU A100,一次模型训练成本超过1200万美元 。”

群“模”大战:打的是什么?谁更有机会?

文章插图
行业垂直大模型则以腾讯和大部分创业公司为例 。据腾讯高级执行副总裁汤道生表示,基础通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求 。基于行业大模型构建自己的专属模型,虽然参数比通用大模型少,但是训练和推理的成本更低,优化也更容易,可能是性价比更高的选择 。
“实际上,并不是所有的大模型研发都需要耗费很大的成本 。”赵增向采访人员透露,具体还是要看其具体的切入点,以及结合具体场景的应用价值、是否使用开源模型等等 。
值得注意的是,关于垂直大模型的成本究竟高不高,目前行业内也有不同说法 。京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬向采访人员坦言,目前垂直行业模型的训练成本和难度并不低,因为行业模型是建立在通用模型基础上的 。如果只用行业数据进行训练,会缺乏常识,以电商退换货为例,比如客户需要出门,无法在当天进行退换货,如果过于垂直的行业模型可能无法准确的理解客户的意图,难以进行有效沟通并完成针对性的后续任务 。
巨头公司PK创业公司
据采访人员不完全统计,在今年人工智能大会发布的近30个大模型中,有近十个大模型来源于中小企业,其中不乏创业公司,包括云天励飞旗下的“云天天书”、星环科技旗下的“星环无涯”、第四范式旗下的“式说”等,和大厂面对面掰手腕,初创公司的机会在哪里?
“在国内,大模型研发本质不是钱和资源的问题,而是切入点和场景的问题 。有很多公司可以通过融资获得研发的第一桶金,门槛并不算特别高 。”第四范式副总裁涂威威向采访人员坦言 。“大厂的规模大,团队也多,不同团队之间可能出现赛马竞争,浪费资源,而创业公司的优势就是能集中大量资源,花费在某个具体模型上的投入未必逊色于大厂 。”
他举例说,大模型就像造工厂,如果建造工厂只为了造一辆车,那确实成本很高,但如果在工厂建成后源源不断地生产车辆,对每辆车的成本而言并不是很高 。目前,各大厂商,包括创业公司,都还处于“造工厂”的阶段,但随着生态的不断完善,未来的成本必然会显著降低 。
“ChatGPT太强大了,对创业公司很不友好 。创业公司基于ChatGPT能够创造的价值非常单薄 。”此前,知名投资人朱啸虎曾经和猎豹移动 CEO傅盛在朋友圈就创业公司该不该入局大模型互怼 。朱啸虎认为,大模型摧毁了创业,因为模型、算力和数据,三大支柱都向大厂集中,看不到创业公司的机会,且直接在大模型上做应用护城河太低 。


推荐阅读