行业大模型快速落地的一年,如何做?


行业大模型快速落地的一年,如何做?

文章插图
生成式AI正成为时下科技企业“讲故事”的关键词之一 。但从发展上看,无论是“文生文”的大语言模型,还是“文生图”的多模态模型,更多的是辅助人们进行一些简单的办公,或者提供一些娱乐,其面对的群体主要是终端的用户 。
消费侧的应用仅是AI大模型的冰山一角,大模型真正的价值则是在行业侧、企业侧的应用,据市场研究机构预测,到2025年,全球生成式AI市场规模将达到100亿美元以上 。其中,企业级生成式AI市场将占据相当大的份额,成为最大的应用领域之一 。
从行业大佬们的发言中也能看出一些相似的观点 。浪潮集团执行总裁、总工程师、浪潮云董事长肖雪曾表示,以大模型“新技术”释放数据“新要素”价值 , 推动数实融合 , 赋能千行百业,打破传统生产要素“质态”,提升经济社会发展“质效”,促进社会“生产力”实现新的跃升;IBM 大中华区董事长、总经理陈旭东曾公开表示,企业级AI应用相较于消费侧 , 有着更广泛的需求和潜力.....
数据质量已成大模型落地关键
随着互联网、物联网等技术的发展 , 数据资源呈现爆炸式增长 。而2023年底多部委联合印发的《“数据要素×”三年行动计划(2024—2026年)》(简称《行动计划》)更是凸显了国家层面对于数据的重视程度 。
【行业大模型快速落地的一年,如何做?】《行动计划》以推动数据要素高水平应用为主线 , 以推进数据要素协同优化、复用增效、融合创新作用发挥为重点,强化场景需求牵引,带动数据要素高质量供给、合规高效流通 , 培育新产业、新模式、新动能,充分实现数据要素价值,为推动高质量发展、推进中国式现代化提供有力支撑 。
大模型作为新产业、新动能的一部分,数据也是大模型训练的关键,企业通过收集、整理和分析数据,为大模型提供了丰富的“燃料” 。对此,浪潮云总经理颜亮对钛媒体表示,过去 , 在应用层面,数据很难发挥出共享、流通以外的更大价值,“通过大模型的加持,尤其是行业大模型的不断涌现 , 整个数据产业将发生质的改变 。”颜亮指出 。
显然 , 从现阶段企业数据质量角度来看,企业进行数据治理的水平参差不齐,绝大多数企业数据质量较低 。现阶段 , 对于绝大部分企业而言,企业内部有60%~70%的内部数据未被使用,企业若能将这部分数据加以利用,这些数据将进一步驱动企业业务发展,对此,阿里巴巴集团副总裁、瓴羊CEO朋新宇曾在由钛媒体集团与ITValue联合主办的“2023 ITValue Summit 数字价值年会”上表示,现阶段大多数企业不具备数据驱动的能力,造成了企业数据应用不足的现状,“不过与数据应用相比,缺乏数据治理能力的企业更多 。”朋新宇指出 。
随着越来越多行业大模型应用的落地 , 数据的质量和多样性也得到了提升,使得大模型能够更好地适应不同的应用场景 。在颜亮看来,大模型在“数据要素×”的战略推进过程中 , 将起到催化剂的作用,“通过行业大模型的应用,能让更多的企业更快地感受到数据带来的价值,”颜亮如是说,“当更多企业切实感受到数据的价值后,就对企业自身的数据愈发重视 , 从而进一步推动了企业的数据治理,提升了企业数据质量 。”
可信赖、易落地、可持续,行业大模型的三大核心要求
虽然数据是大模型的“燃料”,没有高质量的数据就训练不出优秀的大模型 , 但是数据质量只是大模型落地的第一步,如何打造一个能用、好用,能一直好用的大模型 , 是当下企业与大模型服务提供商关注的焦点 。
可信赖层面,因为大模型的训练会涉及海量的数据,尤其是行业大模型 , 需要针对不同企业,不同业务场景,使用企业独有的数据进行大模型的训练 。在这个过程中,如何确保企业的数据不出域,确保企业数据安全,成为当下亟待解决的问题之一 。对此,颜亮表示,在应用大模型产品的过程中 , 企业更倾向于本地部署,同时要具备可靠的安全能力,对企业的数据形成有效的保护 , “数据安全问题是企业选择大模型产品过程中,首要考虑的问题 。”颜亮强调 。


推荐阅读