数智商业技术2.0时代的新「三驾马车」,阿里妈妈郑波谈如何把握生成式大模型( 二 )


数智商业技术2.0时代的新「三驾马车」,阿里妈妈郑波谈如何把握生成式大模型

文章插图
对于商品多模态统一预训练表征,我们使用了预训练 + 微调的两阶段训练范式 。第一阶段使用超过百亿级电商图文语料,采用图文掩码建模任务做无监督预训练,让模型在见过更多数据后,学得更好的图文编码器;第二阶段使用超过十亿级拍立淘成交图文对,采用对比学习任务做有监督微调,并在 loss 上同时对齐图像、文本和图文,不同模态之间更好地对齐 。
为了支持多模态模型的高效训练,阿里妈妈技术团队研发了基于 MDL 训练框架和 AiLake 存储系统的大规模多模态训练平台 。目前基于 100 张 A100 卡,我们可以在两天内完成 50 亿量级样本的训练 。
除了商品检索的多模态技术创新,阿里妈妈还针对智能创意、营销分析、平台提效、业务反作弊等多样化商业场景开发了 AI Serving4LM(大模型服务)引擎,具备千亿参数规模的大模型服务能力 。
数智商业技术2.0时代的新「三驾马车」,阿里妈妈郑波谈如何把握生成式大模型

文章插图
逻辑推理篇
决策智能、增强分析助力商家精准投放
在逻辑推理方面,我将首先介绍阿里妈妈的决策智能技术体系 。
我们以智能营销决策大模型 AIGA(AI Generated Action)为核心塑造了智能营销技术体系,其中 RL-based Bidding(基于强化学习的出价)帮助商家显著提升营销效果,Learning-based Auction Design(基于学习的拍卖机制设计)更加高效地统筹优化多方利益 。该技术体系完整架构如下图所示 。
智能商业化策略解决的是,什么样的资源进行拍卖对平台最高效且最能平衡用户体验和商业收入 。
智能拍卖机制决定了流量资源分配给哪些广告主以及扣多少钱,其本身也是一个可决策问题 。我们提出并落地了 Deep GSP、Neural Auction、Two-stage Auction 等多个创新算法 。
智能出价策略面向精细化出价的决策过程,通过多参出价策略、RL 参数优化或建模范式(如 Max Return 等)进行优化 。
底层是基于算法的工程架构,包括海量数据实时处理、ODL(在线深度学习)模型训练等,它们构成技术体系的基础 。
数智商业技术2.0时代的新「三驾马车」,阿里妈妈郑波谈如何把握生成式大模型

文章插图
其实,我们团队很早就开始尝试用生成式大模型重塑智能营销技术体系,并衍生出了 AIGB(AI Generated Bidding)领域技能模型 。作为一种基于生成式模型的出价模型优化方案,AIGB 将策略建模作为条件生成模型,消除了以往 RL 学习视角下的复杂性问题 。
具体地,我们引入生成式模型将序列决策问题建模为一个序列动作生成问题 。模型通过拟合历史轨迹数据中的行为模式,达到策略输出的目标 。从结果来看,在通用数据集上,相较主流 RL 方法取得较好效果提升,为 Bidding 建模提供了一个可用的迭代方案 。
接下来讲如何利用数据进行决策 。对于淘宝平台上百万级中小商家而言,利用数据驱动决策的能力是可望不可及的 。因此,我们希望借助 LLM,让数据转化为知识,并让知识普惠所有商家尤其是中小商家的经营决策 。
如何实现呢?具体流程可以参考如下 demo 。首先利用 LLM 理解客户意图、分析任务规划;然后在分析层,OLAP 引擎对多维数据集进行分析模型的自动化探查,向客户提供描述性、诊断性、预测性和行动性知识;最后 AI analyst 将这些领域知识和洞见以 Data Story 的形式向客户解读 。并且,这些功能将在随后的产品中逐步开放给商家 。
总之,通过增强分析,我们希望发挥数据在高质量业务决策中的关键作用,获得更深刻、敏捷的数据洞察 。
数智商业技术2.0时代的新「三驾马车」,阿里妈妈郑波谈如何把握生成式大模型

文章插图
最后来看智能营销引擎,我们形成了多模态应用范式驱动的交互式策略生成技术工程体系 。在逻辑推理的工程引擎方面,为了更好地提升客户投放效率和效果,阿里妈妈自研超融合多模智能引擎 HME 。
目前我们已经形成覆盖 OLAP、AI、Streaming、Batch、运筹优化五大方向的智能超融合引擎,围绕洞察 - 策略 - 投放 - 衡量的全链路场景,解决商家多经营目标组合优化的难题 。
创造性篇
用创意服务为商家减负和增效
至于阿里妈妈的创造性方面,我将通过以下几个场景具体展开 。
第一个场景是智能图文创意 。针对很多中小商家没有制作创意图预算的情况,我们利用内容生成技术为他们制作创意图片 。目前每天为百万商家制作数以亿计的商品创意图 。
同时为了让创意图片更美观且更原生,我们研发一整套图片制作算法,包括 AI for 底图生成、图片智能布局和基于上下文的多模态图上文案生成 。


推荐阅读