作者:沈拙言
在关于金融大模型的诸多讨论中,“落地应用”成了最终关键词 。
对金融业务而言,精准与安全合规是任何技术得以应用的最大前提 。因此,金融大模型的应用便绝非简单的“拿来主义”,需要在通用基础上结合业务需求反复精调,这也是当前金融大模型的主要发力点 。
7月末,据腾讯研究院副秘书长杨望调研分析,国内参数在10亿规模以上的大模型数量已由5月末的79个增加至116个,其中金融行业大模型约18个 。
有观点认为,大模型的出现,可能会把金融机构的数字化转型进程拉到同一起跑线,填补金融机构间的“转型鸿沟”,这对中小金融机构来讲是不容错过的机遇 。
在保证信息精度与安全合规的前提下,抢先获得金融业务场景的商用突破,成为18家金融大模型研发机构竞争的决胜点 。
各显神通抢赛道
3月底,全球最大的财经资讯公司彭博社发布拥有500亿参数的大型语言模型——BloombergGPT,标志着全球首个金融大模型的诞生,也掀起了国内金融大模型的浪潮 。
彭博社表示,该大模型在3630tokens金融数据集、3450亿tokens公共数据集之上进行训练,可全方位支持金融领域NLP(自然语言处理)任务,表现明显优于其他类似规模的开放模型,在一般NLP基准上的表现也达到甚至超过平均水平 。
BloombergGPT一声炮响,给国内带来了实践方向 。
文章插图
图1:国内主要金融大模型时间轴(不完全统计)来源:零壹智库
5月,大数据基础软件供应商星环科技推出第一款面向金融量化领域的生成式大语言模型“无涯Infinity” 。据其介绍,无涯Transwarp Infinity支持股票、债券、基金、商品等市场事件的全面复盘、总结及演绎推理,以及政策研报的深度分析,为基金经理提供决策辅助 。
5月下旬,度小满推出国内首个千亿级中文金融大模型“轩辕”,该模型是在1760亿参数的Bloom大模型基础上训练而来,聚焦于金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务 。度小满CTO许冬亮表示,轩辕大模型基于度小满实际业务场景积累的海量金融数据进行训练,保证在提升金融能力的同时,不会损失通用能力 。
6月,恒生电子发布金融行业大模型LightGPT 。据其介绍,LightGPT使用了超4000亿tokens的金融领域数据(包括资讯、公告、研报、结构化数据等)和超过400亿tokens的语种强化数据(包括金融教材、金融百科、政府报告、法规条例等),并以之作为大模型的二次预训练语料,支持超过80+金融专属任务指令微调 。
6月29日,拓尔思发布拓天大模型,并面向媒体、金融、政务领域推出了三大行业大模型 。在金融大模型上,公司基于自有的110亿+金融主题数据、百亿级产业指标数据、30亿+产业要素明细数据、2亿+产业动态本体、500+以上标引维度、10000+知识标引规则、10万+产业标签作为专业训练数据 。就在日前,拓尔思发布公告,计划募资18亿元用于拓天行业大模型研发及AIGC应用产业化项目 。
7月,马上消费透露将正式发布自主大模型,聚焦“自主动态强化学习能力的大模型(AIGC+RLHF)、多种模型组合式的AI系统、多模态音视频实时人机结合”三项核心关键能力,致力解决金融行业大模型在落地过程中的安全可控和隐私保护、基础设施能力建设等方面的关键问题 。
在金融大模型浪潮中,财富管理机构与运营商也不甘落后 。海通证券、申万宏源、广发证券、兴业证券、长江证券、西南证券、国海证券、国盛证券、华福证券、财达证券10家券商宣布成为百度“文心一言”首批生态合作伙伴,以同花顺、东方财富为代表的财富管理运营商也公告称将重点打造AI投顾平台,深入AIGC、交互式AI等领域的研究,完善内容生态构建,增强智能运营能力 。
腾讯云则瞄准金融安全领域,推出金融风控大模型,锚定机构交易、信贷、营销等场景的风控需求 。腾讯云天御首席科学家李超认为,风控尤其是贷前风控环节有着最紧迫的需求,在信贷领域,因黑产造成的欺诈已经占到了整个逾期规模的40%-70% 。
科大讯飞发布的大模型产品“讯飞星火智能客服”,以帮助金融机构提高客户服务效率和质量,提升用户体验为主旨 。讯飞星火智能客服产品在意图理解能力、专业知识应用能力、对话设计与交互能力、个性化表达能力四个层面取得了全面提升,未来还会进行迭代升级,探索与金融场景更贴近、更有价值的技术服务 。
推荐阅读
- 大模型会改变我们的生活吗?
- AI大模型要革AI的命
- 新华社研究院发布国产大模型报告:讯飞星火第一,百度文心第二
- 从语言模型到多模态,AI大模型如何当好“人类助手”引热议
- AI大模型 疯狂内卷
- 大模型速度狂飙2.39倍!清华联手微软首提SoT,让LLM思考更像人类
- 把大模型装进手机,分几步?
- 国产AI大模型哪家强?十大维度横评四款主流大模型!
- 网易胡志鹏:从游戏到产业,AI大模型价值正显现
- 清华发布SmartMoE:一键实现高性能MoE稀疏大模型分布式训练