现在位置：首页常识

1×1卷积核的两个作用?

时间：2024-07-19 15:30:25 浏览： 100

作用：1. 实现跨通道的交互和信息整合；2. 进行卷积核通道数的降维和升维

详细如下：

提升跨通道的信息整合与信息交互。我们知道，1*1的卷积核的每一个过滤器可以实现跨通道的信息通信，因此，尽管是简单的线性组合，但是却丰富了信息的表现形式，因此有利于特征的提取。
进行升维与降维并减少网络参数。其降维并减少网络参数的特点在GooLeNet中表现得一览无遗；其升维并减少网络参数的功能在ResNet中使用得非常突出。

作用一

多通道+多卷积核做卷积示示意图

输入图像layer m-1有4个通道，同时有2个卷积核w1和w2。对于卷积核w1，先在输入图像4个通道分别作卷积，再将4个通道结果加起来得到w1的卷积输出；卷积核w2类似。所以对于某个卷积层，无论输入图像有多少个通道，输出图像通道数总是等于卷积核数量！

缩进对多通道图像做1x1卷积，其实就是将输入图像于每个通道乘以卷积系数后加在一起，即相当于把原图像中本来各个独立的通道“联通”在了一起。

作用二

1、1x1的卷积核（可能）引起人们的重视是在NIN的结构中，利用MLP代替传统的线性卷积核，从而提高网络的表达能力。文中同时利用跨通道的pooling的角度解释，认为论文中剔除的MLP其实等价于在传统卷积核后面接cccp层，从而实现多个feature map的线性组合，实现跨通道的信息整合。而cccp层是等价于1x1卷积的，因此细看NIN的caffe实现，就是在每个传统卷积后面接了两个cccp层（其实就是解了两个1x1卷积层）。

2、进行降维和升维引起人们重视的（可能）是在GoogleNet里。对于每一个inception模块（如下图），原始模块是左图，右图中是加入了1x1卷积核进行降维的。

虽然左图中的卷积核都比较小，但是当输入和输出的通道数很大时，乘起来也会使得卷积核参数变很大，而右图加入1x1卷积后可以降低输入的通道数，卷积核参数、运算复杂度也就降下来了。以GoogleNet里的3a模块为例，输入的feature map是28x28x192，3a模块中的1x1卷积通道为64, 3x3卷积通道为128, 5x5卷积通道为32，如图左图结构，那么卷积核参数为：1x1x192x64+3x3x192x128 +5x5x192x32.

而右图对3x3和5x5卷积层前分别加入了通道数为96和16的1x1卷积层，参数就成了：1x1x192x64+(1x1x192x96+3x3x96x128）+（1x1x192x16+5x5x16x32）。整个参数大约减少了三分之一。

同时，在并行pooling层后面加入1x1卷积核后可以降低输出的feature map数量，左图pooling后feature map是不变的，再加卷积层就得到feature map，会使输出的feature map扩大到416，如果每个模块都这样，网络的输出会越来越大。而右图在pooling后面加入了通道为32的1x1卷积，使得输出的feature map数降到了256。

GoogleNet利用1x1的卷积降维后，得到了更为紧凑的网络结构，虽然总共22层，但是参数数量却只有8层的AlexNet的十二分之一（当然很大一部分原因可能是去掉了全连接层）。

近来十分热门的MSRA同样也利用了1x1卷积，并且是在3x3卷积层的前后都使用了，不仅进行了降维，还进行了升维，使得卷积层的输入和输出的通道数都见笑，参数数量进一步减小，如下图所示。

本文分类：常识
浏览次数：100 次浏览
本文链接：https://m.liabaike.com/changshi/xgKMbpWjJm.html

上一篇 > 新西兰风景，一个充满神秘感的国家，也是一个美丽的国度
下一篇 > 委内瑞拉圭亚那争议地区概况

相关推荐：

如何能抓回一个女人的心（只需用对这三个方法）08-09

我该怎么处理老公出轨（老公出轨，这样反击虽然解恨，却大错特错）08-09

风控系统是做什么的（交易者必修课之风控体系）06-07

债券型基金是什么意思？影响债券基金的因素有哪些？06-06

TCL电视机LED32C550，机芯81-PWE032-PW14电源板黑屏检修06-06

风冷冰箱噪音为什么很大（家用冰箱直冷和风冷哪个好？）05-09

木楼梯为什么响（实木楼梯的优缺点）05-09

为什么要涉水卫生批文（涉水批件是什么意思？）05-08

为什么要设绝缘垫（绝缘垫的知识都在这里啦）05-08

为什么要进行基坑回填（基坑回填、房心回填定额价与市场价的"爱恨情仇"）05-07