网络退化问题与ResNet

九坪 · 发表于 2023-1-7 18:49:53

动机与思想

网络退化问题：随着网络深度增加，网络的表现先是逐渐增加至饱和，然后迅速下降。
网络退化不是过拟合导致的，过拟合的表现是高方差低偏差，训练集误差小，而测试集误差大，但从下图可以看出，不论训练集还是测试集，效果都不如浅层网络好，训练误差就很大。

网络退化也不是梯度消失/爆炸导致的，因为梯度消失/爆炸问题很多程度上通过normalized initialization和intermediate normalization lyaers得到了解决。
如果存在某个k层的网络f是当前最优的网络，那么可以构造一个更深的网络，其最后几层仅是网络f第k层输出的恒等映射（identity mapping），就可以取得与f一致的结果；也许k还不是最佳层数，那么更深的网络就可以取得更好的结果。所以，按照常理来说，深层网络不应该表现得更差。一个合理的猜测就是，恒等映射并不是那么好学的。
所以resnet的思想就是：不让这些stacked layers直接学习underlying mapping，而是显式地学习residual mapping。用 \rm \mathcal H(x) 表示underlying mapping，让这些层去学习 \rm \mathcal F(x) :=\mathcal H(x) - x，所以本来的要学的映射就变成了 \rm \mathcal F(x) +x （假设输入x和输出f(x)维度是相同的）。学习residual mapping比学习本来的映射要容易，极端情况下，如果恒定映射是最优的，那么it would be easier to push the residual to zero than to fit an identity mapping by a stack of nonlinear layers.

shortcut connections执行恒等映射，不会加任何参数和计算量

用公式表示一个building block： \rm y = \mathcal F(x,{\{\it{W}_i}\})+x , \rm x 和 \rm y 分别表示输入和输出向量， \rm \mathcal F(x,{\{W_i}\}) 表示要学习的residual mapping，像Fig2中，有two layers，那么 \rm{\mathcal F} = \it{W}\rm_2\sigma(\it{W}\rm_1x) ， \sigma 为ReLU， \rm \mathcal F + x 为element-wise addition，对addition之后的结果再执行非线性激活函数。
上面公式中要求 \rm x 和 \rm \mathcal F 维度是一样的，如果不一样，就再执行一个线性映射来使维度匹配： \rm y = \mathcal F(x,{\{\it {W}_i}\})+\it{W}_s\rm x （1x1卷积来改变通道数）
层数至少为2层，如果只有一层，那就是一个线性层 \rm y=\it{W}_\rm 1x+x ，就起不到作用了。

一些实现细节

没有使用dropout
following [16]，在卷积层之后使用BN（激活函数之前） conv+BN+relu

网络结构

注意18层和34层的网络building block有两层(Fig5 left)，50层开始就是三层了(Fig5 right)

右图中的1x1卷积用来降低/增加维度

ResNet的效果

可以看到，使用残差学习后，34层的网络表现比18层的网络好

残差函数的响应强度

ResNets比它对应的plain版本具有更小的响应(smaller responses)

为什么神经网络很难学恒等映射？

学习恒等映射，也就相当于让多加的那几层网络什么都不学，由于激活函数的存在，每次输入到输出的过程几乎是不可逆的，非线性的存在，使得特征随着前向传播逐层完整保留都基本上做不到，所以神经网络很难什么都不做。
关于ResNet为什么有效的一个解释思路

将一个三层的ResNet展开，可以得到下面的结构

这样残差网络可以看作是一系列路径集合组装而成的一个集成模型。

[16] S. Ioffe and C. Szegedy. Batch normalization: Accelerating deep network training by reducing internal covariate shift. In ICML, 2015.
TniL：残差网络解决了什么，为什么有效？
Residual Networks Behave Like Ensembles of Relatively Shallow Networks

万百千 · 发表于 2025-6-22 16:45:37

这么强,支持楼主，佩服

咱比比黑 · 发表于 2025-7-18 12:55:41

站位支持

不老的天空 · 发表于 2025-8-24 18:44:58

very good

		自动登录	找回密码
密码			立即注册