GPU使用错误:维度不匹配

博客指出看似维度不匹配的错误,实际是生成数据的问题。使用Dataparallel加载数据,因将positional embedding维度设为[1, length, embed_dim],在两块GPU进行数据并行时不满足分配,导致维度不匹配。解决方法是将其维度初始化为[batch_size, length, embed_dim]。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

错误:
在这里插入图片描述
上述错误看着像是维度不匹配,实际是生成数据的错误
1、GPU数量2,使用Dataparallel加载
inputs:[batch_size, length]
其中的一个输入,即bert中positional embedding,偷了个巧,反正每个样本其值都一样,所幸在DataLoader中将其维度设置为[1, length, embed_dim],然后就悲剧了。
模型进行数据并行时,例如这里是两块GPU,实际是将数据分成两份,按照batch_size的维度进行分配。如果positional embedding的维度为[1, length, embed_dim],那么就不满足分配,所有就出现上图维度不匹配的错误。
解决方法:
只需将positional embedding的维度初始化为[batch_size, length, embed_dim]

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值