视觉框架

2019-04-14  本文已影响0人  雨住多一横

原博客

基础知识整理

图像

拿到一张图片,视觉程序需要了解的信息有:

视屏

原始视屏就是有序图片序列,其中每张图片即为1帧(frame),压缩后的视频,会采取各种算法减少数据容量,如IPB。

摄像机

在实际应用当中,基本上都是通过不同种类的摄像机来获取数据,然后发送给服务端(AI Server)进行处理,分类有:

GPU和CPU

对于深度学习,或者处理类似图片的矩阵形式的数据,我想是离不开GPU的。

GPU在设计上,高延迟,可是高吞吐量。GPU的特点是有很多的ALU和很少的cache. 缓存的目的不是保存后面需要访问的数据的,这点和CPU不同,而是为thread提高服务的。如果有很多线程需要访问同一个相同的数据,缓存会合并这些访问,然后再去访问dram(因为需要访问的数据保存在dram中而不是cache里面),获取数据后cache会转发这个数据给对应的线程,这个时候是数据转发的角色。但是由于需要访问dram,自然会带来延时的问题。

参考书和公开课

开源框架

深入视觉学习

视觉顶会

顶刊

上一篇下一篇

猜你喜欢

热点阅读