数据集分享Python 各类包环境配置 及 使用技巧

CIFAR10数据集手动下载和导入

2020-03-10  本文已影响0人  廿怎么念

1 简介:

CIFAR10 数据集由加拿大Canadian Institute For Advance Research发布,该数据集包含十大类物体彩色图片,每个类收集6000张32×32大小的图片,共6万张,其中5万张为训练集,1万张为测试集。

CIFAR10数据集

2 下载

可通过下列代码直接下载:

(x,y), (x_test, y_test) = datasets.cifar10.load_data()

该代码自动从下面的地址下载数据

https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz

通常这样下载会比较慢,我们可以复制该链接,用迅雷等下载工具下载。下载完成后,会得到一个名为cifar-10-python.tar的压缩文件

CIFAR10压缩文件

把该文件拷贝到C盘users下的keras/datasets中,例如下图

keras/datasets

然后把cifar-10-python.tar的文件名改为cifar-10-batches-py.tar,这里要特别注意,网上有些博客上写的是改为cifar-10-batches-py.tar.gz是错误的,至少在我这里没有运行正确。改好名字之后再运行下列代码即可:

(x,y), (x_test, y_test) = datasets.cifar10.load_data()

事实上,如果没有手动拷贝压缩包到C盘的~/keras/datasets文件夹的话,上面的这行代码会把数据下载到该文件夹下,并将它命名为cifar-10-batches-py.tar。

总结经验:当用datasets.xxx.load_data()数据时,如果出错或下载过慢,可以首先拷贝该行代码下的Downloading data from给出的网址,然后用迅雷等下载工具下载数据。然后,观察这行代码在C:users\xxx\kears\datasets中创建了什么文件,把该文件名拷贝下来。等数据下载完成之后,把下载的数据拷贝到这个路径,并重命名为拷贝下来的文件名即可。

上一篇下一篇

猜你喜欢

热点阅读