大模型竞速2024:服务、应用、MaaS

年末的大模型赛道静悄悄 。
既没有电商领域的drama反转,也没有游戏行业那般的连续地震,除了行业媒体的零星解读外,相对突破赛道圈层而进入大众视野的消息,还是字节跳动与百度两家头部与海外大模型相互套壳的新闻 。
或因大模型在商业化天平的两端都未曾诞生足够引领潮流的产品 , 即使国内“百模大战”热闹了一整年 , 但预想中的“iphone时刻”仍未到来 , 以致于市场对相关消息出现了脱敏现象——大模型的推出与后续的刷榜难以再获取市场关注 。
在落地成果出现之前 , 市场进入了明显的冷静期 。但不可否认的是 , 国内的创新仍在发生 。过去一年 , 我们见证了国内大模型从无到有再到枝繁叶茂,其中文领域能力持续爬坡,以及各玩家在商用落地道路上的诸多探索 。
说白了,我们踏上这条道路也仅仅一年时间 。得与失的讨论更应该集中在“得”而非“失”之上 。
头部公司带领的三次转向
亚里士多德提出的第一性原理认为,万事万物都有一个根基性命题或假设,不能缺省 , 也不能被违背 。以此来浅析当下的大模型行业,其数据、算力、能力等维度的攀升显然是题中之义 。
因此,领跑中国大模型速度的是头部科技企业,数据与算力储备为他们踏入新时代风口提供了不小的先发优势 。
据不完全统计,国内大模型数量已达200以上 。共同缔造“中国速度”的先行者是百度、阿里、字节等头部互联网公司 。先行者效应下,他们的一举一动也一定程度上牵动行业的发展方向 。
自百度三月发布文心一言起,直至年中时期如腾讯、京东、华为等大厂搭上大模型的班车,这段时间可以说是国内大模型赛道的混沌期 。
所谓混沌,是初生的无序状态 。平台类大厂、互联网大佬与高校科研团三股势力在ChatGPT3.5的爆点后迅速达成“生成式AI代表未来”的共识,以捣鼓出自家的大模型为第一要务 。彼时的业内语境中,训练模型被戏称为“炼丹”,然而炼的什么丹、给谁吃、有什么用以及怎么用 , 大多都还处于盲目的状态 。
有人向往AGI的星辰大海,有人希望重塑千行百业,有人仅仅只是炒作拉股价 。
这段时期内,大模型的中文领域能力大部分不及GPT3.5,其价值停留在纸面上,有待发掘 。自用户层看 , “松鼠鳜鱼法”与不少开放测试的大模型一直重复初次回答的糟糕体验亦是混沌期的小小注脚 。
年中,距离开源“英雄”LLaMA为业界提供了模型结构、训练方法等标准答案已有4个月,够多个大厂复用其成果 。这进一步缩小了国内模型能力代差 , GPT3.5的里程碑被越来越多的玩家触及,通用大模型发展进入相对平稳的瓶颈期
与此同时,GPU供不应求下的算力紧张、大模型厂商的造血内需推动将大模型落在实处的清风逐渐吹起 。
在商业化落地不明朗 , 成本、周期难把控等问题下,大干快上通用模型被描绘为春秋笔法 。此后两个月是行业大模型的集中发布期 。腾讯云的MaaS解决方案、京东产业大模型与华为盘古大模型为赛道的垂直转向定下基调 。
一时间,金融、工业、教育等主要产业的垂直模型如雨后春笋般出现 。
在PMF(产品市场匹配)的第一性要求下,主流范式是只取基础模型的理解能力与少量对话、推理能力“一瓢饮”,调用大模型时代前的AI模型与数据库获取结果,最后再由大模型“组装结果” 。
这一模式虽相较基础模型的万卡规格相去甚远 , 亦一定程度上缓解幻觉问题,但精调、部署的基本流程下依旧刚需数百张GPU和不短的时间成本 。因而其更像是厂商对大模型落地的迫切与客户企业的降本需求“一拍即合”的权宜之计 。
此外,一个值得思考的问题是AI生产力工具,为我们带来的究竟是降本还是增效?
针对不同发展阶段的企业,AI工具的能力偏向将显著影响接受度和满意度 。通过SFT(精调)行业大模型的范式以快速落地看,企业购买大模型能力并未给业务带来本质上的增效,而是为既有AI工具和模型配上一个大脑 。
换言之,此前的行业大模型更偏向于降本而非增效,更适用于收缩期的企业,尤其是已建立起AI工具体系的大型企业 。那么行业大模型相对更易向上渗透,抓住大B而非小B的现状也就不难理解了 。
此后 , 垂直模型的技术底座持续演进,目前以调用向量数据库和RAG(检索增强生成)两个“外挂”为中心轴,不过这是后话了 。


推荐阅读