卷积|深度学习：全卷积网络( 三 ) |网络|转置|

，例如，根据输入与输出的尺寸之比来映射。映射后的
和
通常是实数。然后，在输入图像上找到与坐标
最近的4像素。最后，输出图像在坐标
上的像素依据输入图像上这4像素及其与
的相对距离来计算。双线性插值的上采样可以通过由以下bilinear_kernel函数构造的卷积核的转置卷积层来实现。限于篇幅，我们只给出bilinear_kernel函数的实现，不再讨论算法的原理。

In [10]: def bilinear_kernel(in_channels, out_channels, kernel_size): factor = (kernel_size + 1) // 2 if kernel_size % 2 == 1: center = factor - 1 else: center = factor - 0.5 og = np.ogrid[:kernel_size, :kernel_size] f ilt = (1 - abs(og[0] - center) / factor) *(1 - abs(og[1] - center) / factor) weight = np.zeros((in_channels, out_channels, kernel_size, kernel_size), dtype="f loat32") weight[range(in_channels), range(out_channels), :, :] = f ilt return nd.array(weight)
我们来实验一下用转置卷积层实现的双线性插值的上采样。构造一个将输入的高和宽放大 2 倍的转置卷积层，并将其卷积核用bilinear_kernel函数初始化。
In [11]: conv_trans = nn.Conv2DTranspose(3, kernel_size=4, padding=1, strides=2) conv_trans.initialize(init.Constant(bilinear_kernel(3, 3, 4)))
读取图像X ，将上采样的结果记作Y 。为了打印图像，我们需要调整通道维的位置。
In [12]: img = image.imread("../img/catdog.jpg") X = img.astype("f loat32").transpose((2, 0, 1)).expand_dims(axis=0) / 255 Y = conv_trans(X) out_img = Y[0].transpose((1, 2, 0))
可以看到，转置卷积层将图像的高和宽分别放大2倍。值得一提的是，除了坐标刻度不同，双线性插值放大的图像和9.3节中打印出的原图看上去没什么两样。

In [13]: d2l.set_f igsize() print("input image shape:", img.shape) d2l.plt.imshow(img.asnumpy()) print("output image shape:", out_img.shape) d2l.plt.imshow(out_img.asnumpy())input image shape: (561, 728, 3)output image shape: (1122, 1456, 3)

本文插图

在全卷积网络中，我们将转置卷积层初始化为双线性插值的上采样。对于1 × 1卷积层，我们采用Xavier随机初始化。
In [14]: net[-1].initialize(init.Constant(bilinear_kernel(num_classes, num_classes, 64))) net[-2].initialize(init=init.Xavier())9.10.4读取数据集
我们用9.9节介绍的方法读取数据集。这里指定随机裁剪的输出图像的形状为320 × 480：高和宽都可以被 32 整除。
In [15]: crop_size, batch_size, colormap2label = (320, 480), 32, nd.zeros(256**3) for i, cm in enumerate(d2l.VOC_COLORMAP): colormap2label[(cm[0] * 256 + cm[1]) * 256 + cm[2]] = i voc_dir = d2l.download_voc_pascal(data_dir="../data") num_workers = 0 if sys.platform.startswith("win32") else 4 train_iter = gdata.DataLoader( d2l.VOCSegDataset(True, crop_size, voc_dir, colormap2label), batch_size, shuff le=True, last_batch="discard", num_workers=num_workers) test_iter = gdata.DataLoader( d2l.VOCSegDataset(False, crop_size, voc_dir, colormap2label), batch_size, last_batch="discard", num_workers=num_workers)read 1114 examplesread 1078 examples9.10.5训练模型

卷积|深度学习：全卷积网络( 三 )

推荐阅读

最新热文|转身嫁豪门，如今43岁生龙凤胎老公奖励一架飞机，她与罗晋分手后

三峡大坝会诱发大地震？听听中国地震局怎么说

『爱范儿』你还在使用 5 号电池吗？

青海是哪个省的青海是哪个省的简称是什么

挖贝网@较上年同期亏损减少，卓金光电2019年亏损699.63万

爱影音的小龙|这样的前辈才令人敬服，胡军称瞧不起后辈就是瞧不起自己

环球网|中国已无路可退，解放军少将:美国对华＂癫狂性施压＂

办公室|职业生涯拿下900胜有多难？历史上仅7人做到，邓肯领衔3人千胜！

2020年中秋节是几月几号 2020年中秋

红旗h5：红旗再添猛将，有大溜背，爆发197马，才卖13万

蓝梦琳|评分2.2！综艺《你怎么这么好看》被骂毁三观，吴昕昆凌惹来非议

中文名与英文名起得一样是一种啥体验

狼人杀|狼人杀游戏揭露出的职场信息，你看懂了吗？

科技客评|华为P40 Pro的拍照不再领先？vivo X50 Pro完成全面超越

我是愈姑娘|Angelababy又被骂上热搜：从十八线到顶流，她到底做错了什么？点击上面的“关注”，为你解决情感难题

私家车杂谈▲跑高速胎压升高怎么办？低压和高压哪个更容易爆胎

「WWE美国职业摔角」vs 朋克上榜，五场未能在WWE上演的梦幻大战，其实早已上演！AJ

|楼梯踏步板尺寸怎么算

海底探探|这些产品全国停售！紧急召回！你家可能也有，快看看→

发布公告|广汇物流：公司董事、高级管理人员终止减持计划