多视图几何三维重建实战系列之R-MVSNet( 二 ) 作者：浩南来源：公众号@3D视觉工坊上

文章插图
图5 GRU结构示意图
文章插图
为了进一步加强GRU结构正则化的能力， R-MVSNet采用一个CNN将32通道的深度特征映射到16通道的深度特征，然后使用一个三层堆栈式GRU结构对代价图进行过滤(图5-b) 。
深度优化。如图2 ， R-MVSNet利用堆栈卷积神经网络通过在深度方向抓取前后深度信息，然后每个代价图经过GRU的过滤，最后整合形成一个过滤后代价体Cr ，再经过SoftMax处理生成表示深度置信概率的概率体P ，与MVSNet类似，以深度期望值作为参考影像的深度图。
1.3、损失函数的设计
大多数MVS网络通过soft argmin操作回归深度或视差值，其借鉴的假设是在深度方向，每个三维点在多视角图像之间的像素值应该近似，这种假设在深度估计范围均匀采样的情况下是成立的，但如果对于循环神经网络结构，则需要应用逆深度化的方法去采样深度值，已保证一个更大的深度估计范围。所以，作者提出采用交叉熵损失函数将深度回归问题转化为多类分类问题。损失函数如式（4）：
文章插图
(4)
其中， P(i,p)表示的是第i个在概率体P中的体素， Q为在该像素上与P位置对应的深度真值。
2、R-MVSNet实战操作
首先，再次感谢Yaoyao（香港科技大学）给出的开源代码和已经预处理好的模型和数据。其次，因为R-MVSNet是参考MVSNet框架下做出的改进，所以开源数据集和深度估计操作和MVSNet完全一致，这里对数据预处理仅做简单的回顾，详细数据处理内容，请大家回顾实战系列-MVSNet 。
1）环境配置
参考Yaoyao的github主页中installation即可完成环境配置。
（）
2）数据整理
在文末分享的百度云盘中下载数据集preprocessed_inputs/dtu.zip和预训练好的网络models/tf_model_19307.zip 。将tf_model解压，在其中的GRU/中获得训练好的模型 model.ckpt-100000.data-00000-of-00001 。
文章插图

图6 百度云盘数据

将test.py 中的pretrained_model 地址改为tf_model中GRU的地址。

文章插图
图7 更改预训练模型的地址
解压下载好的dtu.zip ，到用于深度估计的数据集。以scan10为例，该文件夹的结构如下图。

文章插图
图8 scan10文件夹结构
3）深度估计
运行代码：

python test.py --dense_folder TEST_DATA_FOLDER --regularization 'GRU' --max_w 1600 --max_h 1200 --max_d 256 --interval_scale 0.8

注意：

flag --dense_folder 要设定为scan10的地址。
flag –regularization表示正则化代价体的方式， R-MVSNet中使用的是GRU网络。
图片的大小可以按照GPU的大小变更参数，但是需要时32的整数倍（特征提取时2D神经网络要求图像是32的整数倍）
Max_d 和interval_scale 建议先按照默认的要求，在使用自己的数据时，我们会给出调整的方式
可以和MVSNet比较发现，可用的分辨率和深度估计范围都得到了提升。

3、结果分析与比较

多视图几何三维重建实战系列之R-MVSNet( 二 )

推荐阅读

辽宋夏金|忽必烈的理财大臣，赤峰市宁城人王文统是如何被杀的？

经营|金融创新应守住风险底线

学霸到底是个褒义词还是带点贬义呢，为啥我身边的总是被学霸喊学霸还有当被别人喊学霸用不想被喊

胎儿被检验出严重缺陷，代孕妈妈有权选择坚持生下孩子吗

娱乐小使者|时尚芭莎道歉说了什么 “良民证”一词引起网友众怒

PCEVATB产品代号也是战斗力：英特尔战略规划师谈CPU代号命名

参考消息网|蝗灾为何会发生？科学家发现蝗虫“集群”秘密

东方体育日报|将在明年7月至9月间实施，联合国推迟奥林匹克休战

梓琦妈妈故事会|不妨尝试“低声教育”，孩子拒绝沟通？可能是父母沟通方式有问题

再创新高！美新增确诊病例超9万白宫疫情工作组会议被批形同虚设

「检车家老司机」找了一年都买不到！12万5成交值吗？网友：还是后驱，手动宝马X1

【国际人物志】馆长表示只能给20个，英国医院急缺尸袋向殡仪馆求助

环球时报|马来西亚官方精液样本抽样检测：六成马来西亚男性精液存在异常

「美好，一直在身边」服务关停，Cat.1起势，双重夹击下NB-IoT是否已到末路？

太平洋电脑网|欧洲核子研究委员会：批准230亿美元来建设超级对撞机

疫情下首次伯克希尔·哈撒韦线上股东会三大问题待解！

畅远数码|却不知如何挑选，下面五款机型闭着眼买，如果你喜欢华为手机

display: flex/column-count/display: grid CSS3实现瀑布流布局

西藏商报|部分商家推出半份菜和免费打包服务，西藏发出“坚决制止餐饮浪费行为”倡议书

车被偷了有明确的嫌疑人不认识警察的情况下报警是不是有用