计算机视觉任务

2018-08-31 本文已影响0人熊大状

项目细节：
1）googlenet和inceptionv3的区别；
在GoogLeNet出来之前，主流的网络结构突破大致是网络更深（即层数增加），网络更宽（即神经元数目增多），但这样做存在一些缺点：

当训练集有限时，参数过多，模型会出现过拟合；
网络越大，计算复杂度越大，设计起来越困难；
当层数增多时，梯度越往后越容易消失；

v3一个最重要的改进是分解（Factorization），将7x7分解成两个一维的卷积（1x7,7x1），3x3也是一样（1x3,3x1），这样的好处，既可以加速计算（多余的计算能力可以用来加深网络），又可以将1个conv拆成2个conv，使得网络深度进一步增加，增加了网络的非线性，还有值得注意的地方是网络输入从224x224变为了299x299，更加精细设计了35x35/17x17/8x8的模块。
2）RNN如何处理文本；
3）数据清洗和文本聚类
4）交叉熵推导
5）xgboost

计算机视觉任务

基于深度学习的目标识别

图像分类

猜你喜欢

热点阅读