深度学习tensorflow报错: Error polling for event status: failed to query event: CUDA_ERROR_ILLEGAL_ADDRESS

 服务器环境:

  1. Ubuntu 16.04.4
  2. tensorflow 1.13.1
  3. cuda-10.0
  4. cudnn 7.4.5

最近在跑point cloud classification的demo PointASNL的时候,当batch_size设置比较大的时候,就会在训练中间出现以下错误:

2020-06-12 00:14:01.824110: E tensorflow/stream_executor/cuda/cuda_event.cc:29] Error polling for event status: failed to query event: CUDA_ERROR_ILLEGAL_ADDRESS: an illegal memory access was encountered
2020-06-12 00:14:01.824142: F tensorflow/core/common_runtime/gpu/gpu_event_mgr.cc:273] Unexpected Event status: 1

一开始以为是gpu的编程代码出现问题,反复检查之后发现并无错误。

从网上搜集资料之后隐约意识到应该是环境版本的问题。

在把cudnn 7.4.5降到cudnn 7.3.1之后,这个问题似乎解决了,希望别再出幺蛾子了。

------------------------

抱歉我回来了。。。惨遭打脸~~~

不是cudnn的问题,应该还是cuda编程的问题。

在此特别要提醒大家要注意核函数的参数<<<a,b>>>。

如果a,b的参数设置不对,是会产生上述报错的。

希望这次是正确的。。。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值