solver.prototxt文件

2020-08-14  本文已影响0人  迎面而来一缕风

net:网络文件的路径;

epoch:epoch表示将所有图片在网络中训练一次所需要的迭代次数。假设训练batch_size为64,即每迭代一次,训练64张图片;若训练集图片总数为320000张,那么所有图片通过网络训练一次,需要320000/64=5000次迭代,即epoch值为5000。若训练10个epoch,总迭代次数为10*5000=50000次。

max_iter:网络的最大迭代次数;

test_iter:测试需要迭代的次数;(测试batch_size*test_iter的值大于等于测试数据的个数)

test_interval:训练时,每迭代test_interval次,进行一次测试;

base_lr:表示基础学习率,在参数梯度下降优化的过程中,学习率会有所调整,而调整的策略可通过lr_policy参数进行设置;

lr_policy:学习率的调整策略;

        fixed:保持base_lr不变;

        step:如果设置step,还需要设置stepsize;返回base_lr*gamma^(floor(iter/stepsize)),其中floor表示返回数字的下舍整数,iter表示当前迭代次数;

        exp:返回base_lr*gamma^iter;

        inv:如果设置为inv,还需要设置power;返回base_lr*(1+gamma*iter)^(-power);

        multistep:如果设置为multistep,还需要设置stepvalue,类似于step,step是均匀等间隔变化,而multistep是根据stepvalue值变化;

        poly:学习率进行多项式误差;返回base_lr*(1-iter/max_iter)^power;

        sigmoid:学习率进行sigmoid衰减;返回base_lr*(1/(1+exp(-gamma*(iter-stepsize))));

momentum:表示上一次梯度更新的权重;

weight_decay:表示权重衰减,用于防止过拟合;

参考链接:https://www.cnblogs.com/hust-yingjie/p/6552744.html

上一篇 下一篇

猜你喜欢

热点阅读