|英伟达开源「Imaginaire」:九大图像及视频合成方法( 三 )
vid2vid
2018 年 , 英伟达联合 MIT CSAIL 开发出了直接视频到视频的转换系统 。 该系统不仅能用语义分割掩码视频合成真实街景视频 , 分辨率达到 2K , 能用草图视频合成真实人物视频 , 还能用姿态图合成真人舞蹈视频 。 此外 , 在语义分割掩码输入下 , 只需换个掩码颜色 , 该系统就能直接将街景中的树变成建筑 。
项目主页:https://tcwang0509.github.io/vid2vid/
本文插图
论文地址:https://arxiv.org/abs/1808.06601
在这篇论文中 , 来自英伟达和 MIT 的研究者提出了一种新型的生成对抗网络框架下的视频到视频合成方法 。 通过精心设计生成器和判别器架构 , 结合空间 - 时间对抗目标函数 , 研究者在多种输入视频格式下生成了高分辨率、时间连贯的照片级视频 , 其中多种形式的输入包括分割掩码、草图和姿态图 。 在多个基准上的实验结果表明 , 相对于强基线 , 本文方法更具优越性 , 该模型可以合成长达 30 秒的 2K 分辨率街景视频 , 与当前最佳的视频合成方法相比具备显著的优势 。 研究者将该方法应用到未来视频预测中 , 表现均超越其他方法 。 该论文被 NeurIPS 2018 接收 。
Few-shot vid2vid
「vid2vid」旨在将人体姿态或分割掩模等输入的语义视频 , 转换为逼真的输出视频 , 但它依然存在以下两种局限:其一 , 现有方法极其需要数据 。 训练过程中需要大量目标人物或场景的图像;其二 , 学习到的模型泛化能力不足 。 姿态到人体(pose-to-human)的 vid2vid 模型只能合成训练集中单个人的姿态 , 不能泛化到训练集中没有的其他人 。
2019 年 , 英伟达又推出了新的「few-shot vid2vid」框架 , 仅借助少量目标示例图像就能合成之前未见过的目标或场景的视频 , 在跳舞、头部特写、街景等场景中都能得到逼真的结果 。
本文插图
项目主页:https://nvlabs.github.io/few-shot-vid2vid/
本文插图
?论文地址:https://arxiv.org/pdf/1910.12713.pdf
在这篇论文中 , 英伟达的研究者提出了一种 few-shot vid2vid 框架 , 该框架在测试时通过利用目标主体的少量示例图像 , 学习对以前未见主体或场景的视频进行合成 。
借助于一个利用注意力机制的新型网络权重生成模块 , few-shot vid2vid 模型实现了在少样本情况下的泛化能力 。 研究者进行了大量的实验验证 , 并利用人体跳舞、头部特写和街景等大型视频数据集与强基准做了对比 。
实验结果表明 , 英伟达提出的 few-shot vid2vid 框架能够有效地解决现有方法存在的局限性 。 该论文被 NeurIPS 2019 接收 。
World Consistent vid2vid
「World Consistent vid2vid」是英伟达在 2020 年 7 月推出的一种视频到视频合成方法 。 vid2vid 视频编码方法能够实现短时间的时间一致性 , 但在长时间的情况下不能时间一致性 。 这是因为对 3D 世界渲染方式缺乏了解 , 并且只能根据过去的几帧来生成每一帧 。
项目主页:https://nvlabs.github.io/wc-vid2vid/
本文插图
论文地址:https://arxiv.org/pdf/2007.08509.pdf
【|英伟达开源「Imaginaire」:九大图像及视频合成方法】在这篇论文中 , 英伟达的研究者引入了一个新的视频渲染框架 , 该框架能够在渲染过程中有效利用过去生成的所有帧 , 来改善后续视频的合成效果 。 研究者利用「制导图像」 , 并进一步提出了一种新的神经网络结构以利用存储在制导图像中的信息 。 一系列实验结果表明 , 该方法具备良好表现 , 输出视频在 3D 世界渲染上是一致的 。
推荐阅读
- 美股研究社|科技股开盘:赛灵思开盘涨超14%,达达集团涨近6%,英伟达跌0.88%
- 英伟达|消息称英伟达计划于12月发布RTX 3080 20GB
- 新机发布|消息称英伟达计划于12月发布RTX 3080 20GB
- IT之家|英伟达黄仁勋:RTX 3080/3090短缺将持续到2021年
- IT之家|英伟达 RTX A6000 12 月开始供货,联想戴尔将推新款工作站
- 版本|微软开源工具MRTK 2.5.0发布,正式支持Oculus Quest
- 行业互联网|英伟达将打造英国最强大的超级电脑,预计年底上线
- |拥抱Arm,将Quadro性能翻倍,英伟达刚刚发布DPU战略
- 英伟达|英伟达CEO表示,ARM过于具体,需要成为一个广泛的计算平台
- 腾讯科技|英伟达CEO黄仁勋:显卡需求超过预期 两款供应短缺或持续到2021年