1.tf 版 调试源代码
https://github.com/philferriere/tfoptflow
问题描述:在训练时,loss不收敛,收敛慢,以及出现loss=NaN的情况。
解决方案:
1.进行梯度剪裁
修改model_pwcnet.py
line317-318.
2.我发现 def deconv中使用了偶数卷积核,觉得不太恰当,将4修改为3
1.tf 版 调试源代码
https://github.com/philferriere/tfoptflow
问题描述:在训练时,loss不收敛,收敛慢,以及出现loss=NaN的情况。
解决方案:
1.进行梯度剪裁
修改model_pwcnet.py
line317-318.
2.我发现 def deconv中使用了偶数卷积核,觉得不太恰当,将4修改为3