7月7日下午,华为开发者大会2023(Cloud)上,华为常务董事、华为云CEO张平安宣布,华为云盘古大模型3.0正式发布 。并表示,华为的“盘古大模型很忙,忙着做事,没有时间作诗 。”此举也被认为是暗指此前发布的大模型喜欢在发布会现场写诗、写散文等动作 。因为华为希望用盘古大模型帮助各行各业,例如金融、政务、矿山、气象等,而非专注在语音大模型层面 。
据称,截至目前,盘古大模型已经在气象、医药研发、电力、语种等领域落地,并交付了多个千亿参数大模型 。
阿里云CTO周靖人提到,“将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方面的服务” 。很明显,这延续了阿里云提出的MaaS(模型即服务)概念 。
百度作为较早入局的玩家,其文心大模型的成果历来受到业界关注 。在本次大会上,百度首席技术官王海峰表示,现在百度已经升级到文心大模型3.5 。效果提升50%、训练速度提升2倍,推理速度提升了30倍 。
除了“国家队”消息外,诸如腾讯在内的互联网大厂也在加速大模型从概念到落地的进程 。
最近20天,腾讯在大模型上的重磅消息频传 。6月19日首次公开透露对大模型的思考,6月26日首次披露自研星脉高性能计算网络,7月7日,腾讯云副总裁、腾讯云智能负责人吴运声介绍,在应用创新方面,腾讯云行业大模型能力应用到金融风控、交互翻译、数智人客服等场景中,提升了智能应用效率 。
可以看到,随着厂商的迅速涌入,国内大模型已经快速走过了概念阶段,如今各家重点均放在了如何落地,以及如何商业化上 。
已经打响的升维战中,门槛抬高、难度加大 。这对于任何厂商而言,都是不小的挑战 。
03
全方位开“卷”
抢占大模型“高地”的正确姿势
事实上,大模型虽然很火,但从入局到真正落地并推向市场,其间难度不小,很多难点已然显现 。资金、人才、基础设施、场景及商业化落地等,成为每个玩家都要跨过的“障碍赛” 。
在大模型发展初期,就有行业人士表示“大模型是大厂的游戏”,言下之意,“大模型非常烧钱”,只有大厂能烧得起 。据钛媒体不完全统计,2022年,华为在研发费用上投入1615亿元,成为研发投入资金最多的企业;其次,腾讯以614亿元、阿里以555亿元排名第三 。百度在过去十年,在AI领域的投入超过1000亿元 。互联网大厂每年在研发上的投入,使其拥有了实力雄厚的研发团队,在大模型赛道上成为当之无愧的“第一梯队” 。
【30家企业争鸣WAIC:大模型进入高维战】但它们也不可能一味地投入而不求回报 。从目前动态来看,均在加快实现行业落地 。雄厚的资金投入研发,尽快实现商业化,再投入到AI模型的开发的训练中——这是一个支撑大模型玩家的循环 。
正如腾讯副总裁、腾讯政企业务总裁李强所说:“大模型时代,数据、网络、算力构成了底层基础设施的‘铁三角’ 。”但同时他也表示,“面向垂直产业的模型,会是大模型价值的引爆点 。”言下之意,资金和技术只是进军大模型行业的必要条件和蓄势,真正的重头戏还在落地层面 。
人才是大模型落地竞争中极为重要的一环 。
今年一季度,各家公司即开始了“抢人大战” 。彼时,王慧文表示愿意拿出75%的股份邀请顶级研发人才,李开复则喊话在全球范围内招募世界级人才,百度愿以25~40k月薪招聘AI大模型算法工程师,阿里更豪气,愿意以40~70k月薪招聘大模型训练及算法工程师 。同时,在某招聘网站上,大模型产品、运营岗位的薪资也达到了35~60k的月薪水平 。
文章插图
▲WAIC2023现场(图:零态LT摄)
其次,算法、算力、数据等“基础设施”仍是大模型的重中之重 。据相关机构对国内外10款AI大模型的测评,整体来看,国内大模型在词句理解和知识题方面超越国外模型,即国产AI大模型对?字的基础认知和学习能?较强 。但同时,也应注意到,在数据层面,大模型的发展需要高质量的训练数据集 。
在算力层面,虽然我国已有阿里、百度、腾讯、华为等一些头部科技公司完成数据中心建设,也不乏商汤、旷视等垂直领域的玩家大笔投入,但在容量上仍有不小的提升空间 。
最后是落地场景和商业化方面 。
推荐阅读
- 如何建设企业文化软实力体系
- 吃过亏才懂,应聘同一个企业,校招和社招的薪资待遇差别很大
- 如何推动企业文化落地实施
- 企业文化如何促进企业发展
- 00后整顿职场“受挫”,超千万应届生或将流入市场,企业挑花眼了
- 人民日报评价拒绝招聘川大企业,网友不仅不买账还开始冷笑,为啥
- 从企业高管到专车司机
- 激起众怒,屡遭企业抵制,川大删除自媒体,回避沟通,能行吗?
- win8.1企业版密钥 win8企业版密钥
- 企业校园招聘存在的问题有哪些?