打卡第四天-数据驱动的图像分类方式:K最近邻与线性分类器(上)
2018-08-21 本文已影响0人
路小漫
图像分类
- 计算机视觉的核心问题
为什么对计算机来说是困难的:
- 在计算机中一张图片是一堆像素
- 拍摄角度
- 光线不同
- 姿态不同
- 遮挡问题
- 背景干扰
- 多个目标图像
传统编程思想无法解决图像分类问题
比较早的时候也没有大量数据供使用
通过大量数据训练模型来进行图像识别——图像分类器
CIFAR-10 训练集:
- 10个类别
- 50000训练图片,32✖️32
- 10000测试图片
k最近邻分类器
- 记住所有有标签的图片
- 将给定的新的图片与记住的图片一一对比,判断它的标签
如何对比图片
-
计算曼哈顿距离:每个像素的差的绝对值求和
-
找到距离最近的图片对应的标签
-
数据越多,测试耗费的时间越长
-
欧式距离:像素差平方和开根号
超参数
- 距离算法:曼哈顿、欧式
- k,选择几张距离最近的图片对应标签来投票决定测试图片的标签
- 选择超参数的方法:测试不同的值
- 交叉验证法,找到合适超参数,防止过拟合
算法的缺点
- k-近邻算法不会用在图像分类上
- 图片略做变动,距离值会有很大的变化,很难得到很好的分类结果。
线性分类器
此处引出神经网络,卷积神经网络