|不限机型，手机端实时玩转3D、混合现实，快手Y-tech有黑科技( 三 )

本文插图

本文插图

图 5：HC depth 数据集示例
多数据集训练策略
为了训练通用的单目深度估计模型，这篇论文在多个不同的数据集上进行训练。在非凸函数的全局优化中，深度数据在各种场景中的分布不同，导致训练时难以收敛。这篇论文受到课程学习的启发，提出了一种增量式数据集混合策略，以加速网络训练收敛并提高训练模型的泛化性能。首先，在具有相似分布的数据集上训练模型，直到收敛为止。然后逐一添加更难学习的不同深度分布的数据集，并为每个 batch 构建一个新的采样器，以确保从这些不平衡的数据集中进行均衡的采样。训练收敛过程如图 6 所示：

本文插图

图 6：多数据集训练策略的 BerHu loss 收敛曲线
结果对比
作者对比了当前最优的深度估计算法，在 NYUv2 开源数据集上的指标对比结果和视觉对比结果见下图，可以看出该论文方法在深度图整体及细节上均好于 SOTA 。

本文插图

图 7：在 NYUv2 上的量化实验对比

本文插图

图 8：在 NYUv2 数据集上的可视化实验对比

本文插图

图 9：在 NYUv2 数据集上的点云可视化实验对比
为了进一步验证模型的泛化性能，作者在 TUM 数据集上进行了方法对比测试如下图，在未见过的场景下，该论文方法预测效果也优于 SOTA 。

本文插图

图 10：在 TUM 数据集上的泛化性测试实验

本文插图

图 11：在 TUM 数据集上的可视化测试实验
最后，为了说明该论文方法在各种具有挑战性场景下的有效性，作者在自采的 HC Depth 上进行了对比测试如下图，可以看出该论文的方法远好于 SOTA 。

本文插图

图 12：在 HC Depth 数据集上的 hard case 性能测试实验

本文插图

图 13：在 HC Depth 数据集上的可视化测试实验
应用
基于深度信息业界已经有了很多相关的落地应用，快手利用深度信息也支持了很多应用的上线落地，如混合现实、3DPhoto、景深虚化等。
混合现实
传统的增强现实 (AR) 技术一般只有空间定位功能，缺少环境感知、深度测量、实时光照等高级能力，虚拟和现实难以真正的融合和交互。快手利用单目深度估计技术实时感知和理解场景的几何信息，并将其与传统的 SLAM/VIO 技术相结合，同时完成了空间计算和场景重建，结合自研的 3D 渲染引擎，打造了移动端的 MR 混合现实系统，给用户带来更逼真、沉浸、新奇的虚实交互新体验。该技术方向大大减少了对特殊硬件 (如深度传感器) 的依赖，可以只利用现有手机硬件实现，技术的普适性可帮助几乎所有用户无门槛使用 MR 技术。用户通过快手的 MR 混合现实系统可以实时体验虚实遮挡、体表运动、虚拟打光、物理碰撞等虚实交互特性。快手最近半年已上线了 “新春灯牌”、“辞旧迎新”、“蹦迪滤镜” 等多款 MR 魔表，是国内首家上线该技术的公司，激发了用户的创造力，提升了用户拍摄生产欲望。

|不限机型，手机端实时玩转3D、混合现实，快手Y-tech有黑科技( 三 )

推荐阅读

「甜初游戏」逆水寒本周最新鲜80级解封费用下调

时尚狂想曲|她17岁被杨幂公司签下，今穿波点上衣配短裤，脸上贴花复古个性

「温娟说历史」马超接班人是马岱，五虎上将其余三人呢？，赵云接班人是陈到

发生@湖北山东浙江5个监狱发生感染目前没有重症病例

咳嗽有痰吃什么水果好什么水果止咳化痰

农民不种大蒜种这货用地窖存，亩产六千多斤3元一斤亩赚2万多

展现出|街拍青春靓丽的打底裤小姐姐，展现出自然美感，很有女神气质

藏在深山的这个村庄，如今成电商“前沿阵地”

景谷红茶,下关景谷月光白茶价格

怎样爱孩子，不会掉入溺爱的陷阱中？

底牌|终于传来好消息！我国主动亮出底牌，俄罗斯：藏得太深了！

988国际热评|美媒质疑印度疫情：感染人数超百万，死亡人数却成谜，非常时期

星座小艾米顺风顺水，财运亨通的4生肖，赚得钵满盆满，5.8号苦尽甘来

文艺圈|想抱马頔遭拒，网友大骂油腻恶心，黄轩录节目在女生面前露上半身

姚振华|深圳最大的隐形富豪，曾靠卖菜赚足300亿，今千亿资产却不上市

本月起，农村“严管”，5种东西别使用，不知情者罚款少不了

很简单！关于红米新机系列“抄袭”，卢伟冰一句话就能解释原因

裤子尺码对照表什么？如何选择适合自己的尺码

青年“好气质”女人如何穿搭？学会这2个穿搭技巧，优雅也没有那么难

安乐传|《安乐传》将播，龚俊迪丽热巴主演，古装武打，加偶像爱情