网资酷

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
楼主: 七分醉意

详解残差网络

[复制链接]

3

主题

12

帖子

23

积分

新手上路

Rank: 1

积分
23
发表于 2022-12-9 22:44:44 | 显示全部楼层
非常好
回复

使用道具 举报

0

主题

4

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-12-9 22:45:44 | 显示全部楼层
好文,写得很棒
回复

使用道具 举报

0

主题

1

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-12-9 22:46:31 | 显示全部楼层
很干
回复

使用道具 举报

0

主题

4

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-12-9 22:47:09 | 显示全部楼层
我觉得前面说的跟集成模型差不多,直接映射可以理解成创造浅层模型
回复

使用道具 举报

0

主题

3

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-12-9 22:48:02 | 显示全部楼层
BN是什么操作呢?
回复

使用道具 举报

2

主题

9

帖子

16

积分

新手上路

Rank: 1

积分
16
发表于 2022-12-9 22:48:22 | 显示全部楼层
batch normalization
回复

使用道具 举报

0

主题

3

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-12-9 22:49:20 | 显示全部楼层
学到了,把BN和ReLU放到前面,确实会提高效率
回复

使用道具 举报

3

主题

8

帖子

17

积分

新手上路

Rank: 1

积分
17
发表于 2022-12-9 22:49:41 | 显示全部楼层
讲得挺好,不过应该加一些过渡,把2015年那篇论文里的分析过程也加上。比如2015年的论文里有提到为什么不用1层实现残差映射,而要用到2层。纬度映射的矩阵Ws其实也可以加到输入X上,为什么没必要加
回复

使用道具 举报

2

主题

6

帖子

10

积分

新手上路

Rank: 1

积分
10
发表于 2022-12-9 22:50:03 | 显示全部楼层
误差表示观测值和真实值的区别,残差表示观测值和预测值的区别,这个写的很好。
回复

使用道具 举报

0

主题

1

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-12-9 22:50:58 | 显示全部楼层
您好,请问公式推导出自哪里呢?xl不是标量吧,[1]提到非标量求导,不能随便使用链式法则呀。。望解答。

[1]https://zhuanlan.zhihu.com/p/24709748
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|网资酷

GMT+8, 2025-7-10 18:43 , Processed in 0.097660 second(s), 20 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表