MNIST终结者:Fashion-MNIST
2017-09-01 本文已影响290人
袁承兴
8月27日,Fashion-MNIST图片库在GitHub上开源,MNIST的时代宣告终结。
这不是巧合,而是Fashion-MNIST蓄谋已久。它克隆了MNIST的所有外在特征:
- 60000张训练图像和对应Label;
- 10000张测试图像和对应Label;
- 10个类别;
- 每张图像28x28的分辨率;
- 4个GZ文件名称都一样;
对于已有的MNIST训练程序,只要修改下代码中的数据集读取路径,或者残暴的用Fashion-MNIST数据集文件将MNIST覆盖,替换就瞬间完成了。
不同的是,Fashion-MNIST不再是抽象符号,而是更加具象化的人类必需品——服装,共10大类:
Label | Description |
---|---|
0 | T恤(T-shirt/top) |
1 | 裤子(Trouser) |
2 | 套头衫(Pullover) |
3 | 连衣裙(Dress) |
4 | 外套(Coat) |
5 | 凉鞋(Sandal) |
6 | 衬衫(Shirt) |
7 | 运动鞋(Sneaker) |
8 | 包(Bag) |
9 | 靴子(Ankle boot) |
如果我们训练的模型能够识别出不同的服装类型,是不是觉得离“智能”更进一步了?没错。Fashion-MNIST要难得多。
我用一个3层全连接神经网络对它做了测试。对于MNIST可以达到95%识别率的训练代码,去训练Fashion-MNIST,最后模型识别率猛降了10个百分点。
对于一个人工智能算法,是否可用的一个根本性度量标准就是:不亚于人类。85%已然是不可用的状态。尽管如此,事情变的更有意思了,不是吗?
更多的算法Benchmark在这里(非深度学习),官方README中收集了未验证的深度学习算法的Benchmark。
本篇所用代码tf_fashion_mnist.py的测试结果:
识别Fashion-MNIST