CIFAR10数据集手动下载和导入
1 简介:
CIFAR10 数据集由加拿大Canadian Institute For Advance Research发布,该数据集包含十大类物体彩色图片,每个类收集6000张32×32大小的图片,共6万张,其中5万张为训练集,1万张为测试集。
CIFAR10数据集2 下载
可通过下列代码直接下载:
(x,y), (x_test, y_test) = datasets.cifar10.load_data()
该代码自动从下面的地址下载数据
https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
通常这样下载会比较慢,我们可以复制该链接,用迅雷等下载工具下载。下载完成后,会得到一个名为cifar-10-python.tar的压缩文件
CIFAR10压缩文件把该文件拷贝到C盘users下的keras/datasets中,例如下图
keras/datasets然后把cifar-10-python.tar的文件名改为cifar-10-batches-py.tar,这里要特别注意,网上有些博客上写的是改为cifar-10-batches-py.tar.gz是错误的,至少在我这里没有运行正确。改好名字之后再运行下列代码即可:
(x,y), (x_test, y_test) = datasets.cifar10.load_data()
事实上,如果没有手动拷贝压缩包到C盘的~/keras/datasets文件夹的话,上面的这行代码会把数据下载到该文件夹下,并将它命名为cifar-10-batches-py.tar。
总结经验:当用datasets.xxx.load_data()数据时,如果出错或下载过慢,可以首先拷贝该行代码下的Downloading data from给出的网址,然后用迅雷等下载工具下载数据。然后,观察这行代码在C:users\xxx\kears\datasets中创建了什么文件,把该文件名拷贝下来。等数据下载完成之后,把下载的数据拷贝到这个路径,并重命名为拷贝下来的文件名即可。