枝头的喜鹊|电商的“穿衣AI”用得好,剁手根本停不了


金磊 发自 凹非寺
量子位 报道 | 公家号 QbitAI
网购看中了一件衣服和一条裤子 , 不知搭配起来效果如何 , 怎么办?
尝尝这款「穿衣AI」 。
如果你在网上看中下面这几件衣服 , 先把它们「保藏」起来 。
枝头的喜鹊|电商的“穿衣AI”用得好,剁手根本停不了
本文插图

然后挑一个模特 。
枝头的喜鹊|电商的“穿衣AI”用得好,剁手根本停不了
本文插图

接下来 , 合成一下 , 就可以看到这些衣服搭配起来的效果啦~
枝头的喜鹊|电商的“穿衣AI”用得好,剁手根本停不了
本文插图

这就是来自亚马逊的一项「穿衣AI」新技术——Outfit-VITON , 并且论文中了CVPR 2020 。
枝头的喜鹊|电商的“穿衣AI”用得好,剁手根本停不了
本文插图

在线衣服穿搭如何实现?
Outfit-VITON主要包括以下几个部门:
外形天生模型:输入是一个查询图像 , 并以此作为终极输出图像的模板;
外观天生模型:将选好的衣服 , 添加到查询图像中的人物身上;
外观优化模型:将上述步骤得到的结果进行细化 , 输出终极效果 。
工作流程如下图所示 。
枝头的喜鹊|电商的“穿衣AI”用得好,剁手根本停不了
本文插图

正如上面所提到的 , 系统的输入是一个 H×W 的 RGB 查询图像x0 , 还包括一组由衣饰组成的额外参考 RGB 图像(x1 , x2 , … , xM) 。
这里需要留意的是 , 这些想要搭配的衣饰图像 , 可以是像流程图中那样的人物完整图像 , 也可以是展示单件衣饰的局部图像 。
然后 , 便是图像分割任务 , 为此 , 研究职员练习了一个PSP语义分割网络 , 记做S , 其大小为H×W×Dc 。
用这个语义分割网络S , 计算查询图像(模特)和参考图像(衣饰)的分割映射 。
分割后的输出 , 就转交给一个「外形天生网络」来处理 , 这样就可以先得到一个大致的轮廓 。
接下来 , 便提取衣饰中的外观特征向量 , 并将其“贴”到对应的轮廓区域 , 也就是流程图中的「外观天生」步骤 。
值得注意的是 , 外形和外观天生网络是分别进行练习的 , 使用统一练习集的单一输入图像;并且 , 在每个练习方案中 , 生成器、判别器和自动编码器是共同练习的 。
枝头的喜鹊|电商的“穿衣AI”用得好,剁手根本停不了
本文插图

最后 , 研究职员还提出了一个「在线优化」模型 , 将原来的衣饰样式 , 更加完整、细致的“贴”到新模特身上 。
亚马逊为网购顾客“操碎了心”
除了这项研究之外 , 亚马逊还有2篇CPVR论文 , 也针对网购顾客 。
在其中一篇论文中 , 研究职员开发了一个系统 , 可以让用户通过描述产品图像的变化 , 来增强产品查询 。
枝头的喜鹊|电商的“穿衣AI”用得好,剁手根本停不了
本文插图

例如 , 你在网购的时候 , 看上了一条玄色连衣裙的款式 , 但是对它的颜色并不满足 。
【枝头的喜鹊|电商的“穿衣AI”用得好,剁手根本停不了】那么 , 你就可以说一句“我想要相同款式的粉色连衣裙” , 那么查询后的结果就会输出相应的产品 。
枝头的喜鹊|电商的“穿衣AI”用得好,剁手根本停不了
本文插图

而另一项研究针对“商品增补” , 也就是说 , 给用户做商品推荐 。
枝头的喜鹊|电商的“穿衣AI”用得好,剁手根本停不了


推荐阅读