产业需要的大模型有哪些?

文 | 脑极体
写下这篇的起因 , 是前不久的一件事 。
我们参与了一个大模型与行业结合的主题论坛 。活动结束之后 , 来自行业主办方的一位代表跟我们交流时却说:“你们一直在说大模型 。到底什么是大模型?多大才算大?为什么不能用小模型?”
这一系列问题又一次让我们意识到 , 智能化的供需双方很多时候根本处在两套话语体系 。你这边Transfomer、Agent的说了半天 , 那边可能还在好奇大模型这三个字到底是怎么来的 。
这种隔膜 , 在AI时代尤为严重 。因为AI技术涉及的链条更长 , 做算法的、做云的、做硬件的、做IT解决方案的 , 以及最后买单的 , 大家可能在各说各的 , 谁也没打算真正理解谁 。
今天 , 各家都在说产业大模型、行业大模型 。确实从技术逻辑上看 , 很容易发现大模型能够给很多行业带来巨大的生产力释放 , 而从技术路线上看 , 中国企业对智能化的接受度更高、需求更强烈 。大模型走向产业实现数实融合 , 是中国AI最具特色的一条脉络 , 在数字中国的大背景下具有极强的宏观战略意义 。
但在实践中 , 这条路却充满了挑战与误解 。
毕竟AI算法公司做toB , 十家有九家做不成 。在大模型toB的新机会窗口前 , 我们首先要确定产业究竟需要怎样的大模型?
产业大模型 , 就不是一种模型
AI公司做大模型结合行业 , 最大的误区在于搞不清供需关系 。
诚然 , 目前行业对大模型的认可与接纳程度已经比较好 , 但智能化项目依旧是一个绝对的买方市场 。技术供应商需要去适配最终用户的需求、能力、背景 , 甚至沟通话术和商业习惯 。
但由于做AI大模型的公司 , 涌入了大量互联网领域的人才和资金 。互联网的供需逻辑是单点供应对大量需求 , 我有一招鲜天下涌进来 。而大模型在很多行业的适配又是很容易就能想到的 。比如工厂需求配料分析 , 银行需要投资分析 , 那我的大模型不是都能分析吗?
于是 , 在这样的“风口思维”下 , 很多AI公司陷入了一个巨大的误区:他们认为我有大模型 , 各行业的客户都应该来找我 。我推出两三个行业的案例 , 其他行业都应该认可 。我的这个大模型哪里都能用 , 所以它就叫产业大模型 。
无论这些AI从业者是真的相信大模型等于产业万金油 , 还是仅仅是故意吹成这样 。在产业客户看来 , 这一幕就等于胡说八道 。他们会觉得 , 金融业用的技术 , 关我煤矿什么事?如果有一种食品 , 说是猫能吃牛能吃人也能吃 , 你敢吃吗?
产业需要大模型做的第一件事 , 就是不要笼统的天差地别的各个行业归纳为“产业”两个字就结束了 。即使在某个行业内 , 大模型都仅仅能解决行业的一个或几个问题 , 更不可能有一种模型能够“包治百业” 。
做IT的都知道 , 有产品更要有服务 , 懂技术更要懂行业 。但做AI的企业 , 尤其是拿着热钱涌入大模型赛场的企业 , 普遍对产业需求的差异性缺乏了解和尊重 。
当然 , 不同行业对大模型的需求也有共通之处 。比如对基础的对话、CV、多模态能力 。但更多的情况下 , 每个行业的只能用意愿、基础数字能力 , 乃至安全需求、时延需求、运维需求都不相同 。在今天的阶段 , 一种大模型能够在具体行业内复制推广已经非常不容易 , 更别想一口吃下几个甚至几十个行业 。
产业智能化 , 优先级永远是产业大于智能化 。
不提硬件和工程化 , 约等于瞎耽误功夫
很多做数字化、智能化的企业 , 在看了客户环境之后会奇怪这么一件事:客户花了大钱买回来的东西 , 其实就是很简单的软件封在一个盒子里 , 然后按照行业要求做了点按钮、UI之类的东西 。甚至这些软件很多都是国外很古早的开源软件进行再封装 , 技术上早就落后了 。这时他们会感叹 , 行业客户的钱可真好骗啊 。
可是问题来了 , 如果我们换个角度思考这个问题 , 要是没有这层封装 , 企业要怎么用呢?难道一家工厂、一座矿山、一片林场 , 要招来和培养一大堆云计算、AI算法层面的人才?而且要让这些数字化人才指导整个企业的生产、运营和销售?这显然是不靠谱的 。


推荐阅读