计算机视觉

2020 年计算机视觉指南

2020-06-01  本文已影响0人  材才才

原文:https://towardsdatascience.com/guide-to-learn-computer-vision-in-2020-36f19d92c934

作者:Insaf Ashrapov

译者:kbsc13(公众号:算法猿的成长)

前言

本文推荐的教程资源都是基于我个人的经验,它们对增加你的计算机视觉理论知识非常有帮助。另外,在学习计算机视觉的理论前,先了解和学习机器学习和 python 方面的知识是更好的做法。


框架

不需要在开始学习计算机视觉的时候,就选择使用框架,但应用新获得的知识是必要的。

对于框架的推荐,没有其他的推荐:

Pytorch 可能需要写更多的代码,但是它更加灵活,所以最好选择使用它,并且越来越多的深度学习研究者都开始采用这个框架。

Albumentation(图像增强)和 catalyst(一个封装 pytorch 的高级 API 的框架)也同样是非常有帮助的,所以也可以使用它们,特别是第一个图像增强的框架--Albumentation


硬件


理论&实践

网上课程

当学习这些课程的时候,推荐将这些理论通过推荐的框架来进行实现。

论文和代码

书籍

并没有太多书需要阅读的,除了下面两本我觉得是非常有用的书,可以任选 pytorch 或者 keras 来实现代码

Kaggle

网址:https://www.kaggle.com/competitions

Kaggle 是一个著名的机器学习比赛在线平台,它包含了各种类型的比赛,其中很多都是计算机视觉方面的比赛。在没有学完课程的时候,就可以开始参加比赛了,因为从比赛开始,可以免费运行很多公开的 kernels(公开的端到端的代码)。


比较困难的学习路线

另外一条学习路径可能是非常困难,但是你不仅可以学到只是做训练模型并预测结果的知识,还可以实现自己的研究,参考自Sergei Belousov aka bes。

需要做的就是阅读并实现下面的所有论文,当然仅仅读完也是非常棒的。

网络结构

语义分割

生成对抗网络(GAN)

目标检测

实例分割

姿势预估


小结

这篇文章是原文作者推荐的入门计算机视觉的一些资源,包括推荐采用的深度学习框架、课程、电子书、查阅论文和代码的网站,以及一个比赛网站,kaggle;

另外还有一条会更加困难的学习路线,也就是阅读经典的论文,从网络结构到常见的计算机视觉方向,检测、分割、GAN以及姿势预估,但完成后收获就会更多,不仅仅是只会运用框架来训练模型,解决问题,还有机会往研究方向发展。

上一篇下一篇

猜你喜欢

热点阅读