大数据爬虫Python AI Sql python库中文参考及测试开发(自动化性能接口安全测试运维等)软件测试

python计算机视觉深度学习4图像分类数据集(机器学习常用数据

2018-07-12 本文已影响43人 oychw

MNIST

图片.png

此数据集是正确分类手写数字，0-9。

MNIST（NIST：National Institute of Standards and Technology，M为modified), 数据经过预处理，以减轻计算机视觉的处理负担，该数据集专注于数字识别。训练集 (training set) 由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局 (the Census Bureau) 的工作人员.

此数据集是正确分类手写数字0-9。在许多情况下它是机器学习算法排名的标准。Geoffrey Hinton将数据集描述为"the drosophila of machine learning"。

MNIST本身包含60,000个训练图像和10,000个测试图像。每个特征向量是784-dim，对应于图像的28×28灰度像素强度。这些灰度像素强度是无符号整数，落在[0,255]范围内。

下载
 wiki参考

Animals：狗，猫和熊猫

image.png

每种动物1000张，共有3000张图片。可以在我们的CPU或GPU上快速训练深度学习模型并获得合理的准确性。

CIFAR-10

image.png

CIFAR-10由60,000 32323 (RGB)图像组成。
CIFAR-10由10类组成，包括：飞机，汽车，鸟，猫，鹿，狗，青蛙，马，船和卡车。

虽然很容易训练在MNIST上获得> 97％分类精度的模型，但在CIFAR-10(以及更大集CIFAR-100)很难获得这样的模型。

挑战来自于物体出现方式的巨大差异。

参考： https://www.cs.toronto.edu/~kriz/cifar.html

SMILES

image.png

SMILES数据集由面部图像组成，这些图像要么是微笑的，要么是不笑的，数据集中有13,165个灰度图像，每个图像大小64*64。数据集中的图像被紧紧地裁剪在脸部周围，允许我们设计机器学习算法专注于微笑识别。

Kaggle：Dogs vs. Cats

Dogs vs. Cats挑战是Kaggle比赛的一部分，旨在设计学习算法正确地将图像分类为包含狗或猫。共提供了25,000张图片
使用不同的图像分辨率。

image.png

参考：https://www.kaggle.com/c/dogs-vs-cats/data

Flowers-17

image.png

Flowers-17数据集是17类别的数据集，每个类别有80个图像，由Nilsback等人策划。

Flowers-17为具有挑战性的数据集，因为规模大，视角，背景负责，变化的光照条件和类内变化。

参考：http://www.robots.ox.ac.uk/~vgg/data/flowers/17/

Flowers-17

上一篇下一篇

猜你喜欢

热点阅读