pytorch conv1d原理说明

艾鹤

已于 2022-05-13 17:10:43 修改

阅读量6.6k

点赞数 3

CC 4.0 BY-SA版权

分类专栏： python 文章标签： pytorch

于 2021-03-01 10:51:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010212101/article/details/114256987

python 专栏收录该内容

63 篇文章

订阅专栏

本文详细介绍了conv1d一维卷积层的工作原理及其应用。解释了如何通过调整参数来改变输出尺寸，并提供了具体实例帮助理解。适用于自然语言处理等领域。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

原理说明

在这里插入图片描述
总结：conv1d对最后一个维度进行卷积，以文本为例，conv1d是将文本的序列维度和embedding维度进行压缩，序列长度这一维按照正常卷积，embeding这一维由设置根据输出的outchannel决定，此处设置的是1，一般计算前，请将序列这一维度permute到最后一维，embedding这一维度调整到倒数第二维。

conv1d官方接口

官方接口中关于输出的大小的计算公式如下:
在这里插入图片描述

参见【原理说明】这一节的图，我们假设输入为7*5，那么：

kernel_size 卷积核大小为2/3/4
N 为batchsize
dilation 为卷积核内部某一纬度相邻元素的差值，默认为1
padding 为填充大小，为调整输入大小的一个参数，默认0
Cin 和Cout 为channel大小，Cin为输入文本通道即为embedding大小5，Cout即为卷积产生的通道数，这里就是指卷积核的个数，这里都是了2
Lin 就是输入的维度大小，Lin=7，即就是句子的长度，Lout就是Lin维度对应的输出维度大小

尝试按照如上公式计算下Lout：

当kernel_size=2时，即实际计算是用的 2x5这个核计算的（5就是最后一个维度的大小，将最后一维抹平为1维)
Lout=[( 7+2×0-1*(2-1)-1 )/1 + 1] = 6，同理可得 kernel_size=3、4时，Lout=5、4，如下图所示的位置。

仅供参考，如有疑问，欢迎交流。

Ref：

https://blog.csdn.net/sunny_xsc1994/article/details/82969867

官方api说明

关于channel的说明，见：https://www.cnblogs.com/Terrypython/p/10310531.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。