中冶赛迪机器视觉讲座-机器人学
人工智能机器视觉概述
2006 心理学家Frank Rosenblatt 首度提出深度学习的概念。
图像识别进入卷积神经网络算法 时代,目前机器视觉用在安防人脸识别多些,在工业上的应用还是少些。
灰度信息 0(深色)~255(白色)
计算机就是通过这些 0-255的矩阵,来理解我们人类的世界。如果读入的彩色图像大小为128*128
,则矩阵大小即为128*128*3
RGB图像是三维的,三个维度分别表示红 绿 蓝三个分量,大小是0到255
每个像素都是由这三个分量组合而成。
图像其实可以看成二维信号,时域信号,010101的分布,通过傅里叶变换可以拆分成不同的频率的正玄波叠加。
那么图像处理就是基于这个原理,去掉部分频率的正玄波得到一个新的结果。
比如,一张人脸照片,我们对它进行傅里叶变换,会获得一张新图,这张图片是时域结果的展示,边缘是深色,中心位置是浅色,因为图片边缘和4个角处频率最高。
比如对时域图进行高通滤波,只保留高频部分,即可获得高清晰的边缘,反之有低通滤波。
卷积神经网络对于图像的处理是一种黑箱模式,我们不知道卷积神经网络对图像处理时内部发生了什么,我们只是给它大量的数据,比如给猫的图片,并给图片打上标签 label。
关于傅里叶的参考文章
百科 关于二进制图像
数字图像概述1
数字图像概述2
机器人学-二维空间位姿
-
1. 位置与位姿简述
空间中的点,他可以被描述成一个坐标向量,也被称为一个约束向量。如图,向量表示点相对于某个参考坐标系的位移
。一个坐标系或者笛卡尔坐标系统,是由一组正交轴构成的,这些轴相交于一个被称为原点的点。
如上图左,在二维世界坐标系下有物体B,因为物体B会移动,为了方便计算,我们建立以B为圆点的坐标系,下图右,在B的坐标系下,有个物体P,以上,根据向量的定位,我们知道了B相对于b的位置,P相对于B的位姿,如何求P相对于世界A的位置?
右下角公式表示:A坐标系下P点位置 = A坐标系下B的位姿 * B坐标系下P点的位置
-
2. 三维空间位姿描述
三维情况实际上是二维的延伸,我们在二维坐标系上增加一个额外的坐标轴Z,它同时与X、Y正交,Z轴的方向符合右手规则,并构成右手坐标系。
右手坐标系:伸出右手,大拇指为X,二指为Y,三指为Z