《深度学习框架PyTorch:入门与实践》
背景:
最近进入老师的视频组,主要搞视频的处理、多目标追踪、跨摄像头行人再识别、视频结构化,这个大方向,把深度学习运用到视频方面。
在此背景下,我去研究用深度学习对目标检测、目标追踪这个方面的内容,开始去了解CNN-->VGG-->ResNet(残差网络)-->R-CNN-->Fast RCNN-->Faster R-CNN-->Mask R-CNN-->SSD -->Yolo(v1\v2\v3),这一系列的网络,想了解这些网络的具体架构,然后运用到自己的实际项目中。
然后跟着博士师兄去阅读ICCV、CVPR、ECCV这些三大顶级会议的文章,选取最近两年和这个方向相关的论文,每个人阅读其中的一部分,相互交流,了解他们的创新点和研究动态,通过合作共享,迅速了解这个领域。
1、Pytorch学习
pytorh只是神经网络的一个运用框架,前面有caffe、tensorflow、keras这些框架,只是pytorch相对于前面这些框架更加简洁,安装也更加方便。Pytorch只是一个工具,还是要在了解深度神经网络的基础上,用Pytorch 这个工具实现自己的效果。
Pytorch是一个新的深度学习框架,出来以后广受欢迎,我们跟着师兄,也从tensorflow转移到pytorch 的阵营。
但目前关于Pytorch的教程很少,大多是从Pytorch官方网站tutorials上面的官方教程,这也是最好的资源,我起初准备直接看这上面的教程,但语言障碍和对神经网络的陌生,看了几次,把各个.ipynb在电脑上跑了一下,就仅仅是跑通了,然后就没有然后,对里的东西很是陌生,完全是在门外徘徊,非常苦恼。
《深度学习框架PyTorch:入门与实践》算是这本书的翻译,以前觉得看英语原文比较好,但发现如果没有一个很好的知识框架和储备,直接看原文耗时而且也不一定能够理解。这种书也正是基于最好的官方教程,翻译成我们能够更好接触的样子。