torch 中多参数用SGD优化办法,以及学习率,batch

2019-06-13  本文已影响0人  小姐姐催我改备注
image.png

这里注意 ,在高学习率的情况下0.1 我们需要batch_size足够大,不然的话变动会很大。

上一篇下一篇

猜你喜欢

热点阅读