2021-03-31
2021-03-31 本文已影响0人
静一下1
Network Compression
![](https://img.haomeiwen.com/i4388713/ae018b69d185b336.png)
![](https://img.haomeiwen.com/i4388713/a44c3f8dc2fc02fc.png)
小的模型难训练,大的模型更容易训练成功
torch 中全连接简单的剪枝
![](https://img.haomeiwen.com/i4388713/ef0b15cc2b67831b.png)
![](https://img.haomeiwen.com/i4388713/eea1024b07ec0bd6.png)
![](https://img.haomeiwen.com/i4388713/c000b70da42abf98.png)
剪枝后的部分权重会变成 0 ,可以提高计算速率 , 但模型占的空间是一样的
![](https://img.haomeiwen.com/i4388713/c26e7fa5e15f9579.png)
![](https://img.haomeiwen.com/i4388713/437f87e5b0ba9659.png)
![](https://img.haomeiwen.com/i4388713/fddc373bd09f9601.png)
低秩近似:
![](https://img.haomeiwen.com/i4388713/27f3617b1d125732.png)
例如 N=20,M=40, K=10
原来weight的个数
加一层连接后weight的个数
实验验证:
![](https://img.haomeiwen.com/i4388713/e4b9282ec2ec3f40.png)
![](https://img.haomeiwen.com/i4388713/88862c5c843e53c0.png)
model2 比model1 要小
小的模型难训练,大的模型更容易训练成功
torch 中全连接简单的剪枝
剪枝后的部分权重会变成 0 ,可以提高计算速率 , 但模型占的空间是一样的
低秩近似:
例如 N=20,M=40, K=10
原来weight的个数
加一层连接后weight的个数
实验验证:
model2 比model1 要小