Conv重要参数介绍

资料:

https://blog.csdn.net/qq_34107425/article/details/104117670

函数

  • Conv1d:常用于文本数据的处理
  • Conv2d:一般用于二维图像

参数

stride:步长

zero-padding:图像四周填0

dilation:控制 kernel 点之间的空间距离

在这里插入图片描述

groups:分组卷积

  • 将对应的输入通道与输出通道数进行分组, 默认值为1(默认输出输入的所有通道各为一组)。
    eg. 输入数据大小为90x100x100x32,通道数32,要经过一个3x3x48的卷积,group默认是1,就是全连接的卷积层。
    如果group是2,那么对应要将输入的32个通道分成2个16的通道,将输出的48个通道分成2个24的通道。对输出的2个24的通道,第一个24通道与输入的第一个16通道进行全卷积,第二个24通道与输入的第二个16通道进行全卷积。

channel: 每个卷积层中卷积核的数量

  • 一般的RGB图片,channels 数量是 3 (红、绿、蓝)
    eg. 假设现有一个为 6×6×3的图片样本,使用 3×3×3 的卷积核(filter)进行卷积操作。此时输入图片的 channels 为 3 ,而卷积核中的 in_channels 与 需要进行卷积操作的数据的 channels 一致(这里就是图片样本,为3) => 4*4

  • 在实际应用中,都会使用多个卷积核。这里如果再加一个卷积核,就会得到 4×4×2的结果。
    在这里插入图片描述
    1. InChannel: 最初输入的图片样本的 channels,取决于图片类型,比如RGB; 2. outChannel卷积操作完成后输出的 out_channels ,取决于卷积核的数量。此时的 out_channels 也会作为下一次卷积时的卷积核的 in_channels; 3. 卷积核中的 in_channels ,刚刚2中已经说了,就是上一次卷积的 out_channels ,如果是第一次做卷积,就是1中样本图片的 channels 。