人工智能00038 深度学习与图像识别书评38 PyTorch实

2024-01-27 本文已影响0人水晓朴

PyTorch实战之Cifar10分类

1.数据准备

我们在前面已经介绍过Cifar10数据集，它是一个常用的彩色图片数据集，它是由10个类别组成的，分别是airplane、automobile、bird、cat、deer、dog、frog、horse、ship和truck，其中，每一张照片都是3*32*32，即3通道彩色图片，分辨率为32*32。

如下代码之前讲解过，这里再次给出： import torch

from torch.utils.data import DataLoader

import torchvision.datasets as dsets

import torchvision.transforms as transforms

batch_size = 100

# MNIST dataset

train_dataset = dsets.CIFAR10(root = '/ml/pycifar', #选择数据的根目录

train = True, #选择训练集

transform = transforms.ToTensor(), #转换成Tensor变量download = True) #从网络上下载图片

test_dataset = dsets.CIFAR10(root = '/ml/pycifar', #选择数据的根目录

train = False, #选择测试集

transform = transforms.ToTensor(), #转换成Tensor变量

download = True) #从网络上下载图片

#加载数据

train_loader = torch.utils.data.DataLoader(dataset = train_dataset,

batch_size = batch_size,

shuffle = True) #将数据打乱

test_loader = torch.utils.data.DataLoader(dataset = test_dataset,

batch_size = batch_size,

shuffle = True)

2.定义神经网络神经网络的定义代码具体如下：

from torch.autograd import Variable

import torch.nn as nn

import torch

input_size = 3072

hidden_size = 500

hidden_size2 = 200

num_classes = 10

num_epochs = 5

batch_size = 100

learning_rate = 0.001

#定义两层神经网络

class Net(nn.Module):

def __init__(self,input_size,hidden_size,hidden_size2,num_classes):

super(Net,self).__init__()

self.layer1 = nn.Linear(input_size,hidden_size)

self.layer2 = nn.Linear(hidden_size,hidden_size2)

self.layer3 = nn.Linear(hidden_size2,num_classes)

def forward(self,x):

out = torch.relu(self.layer1(x))

out = torch.relu(self.layer2(out))

out = self.layer3(out)

return out

net = Net(input_size,hidden_size,hidden_size2,num_classes)

print(net)

3.训练用于训练的代码具体如下：

# optimization

from torch.autograd import Variable

import numpy as np

learning_rate = 1e-3

num_epoches = 5

criterion = nn.CrossEntropyLoss()

optimizer = torch.optim.SGD(net.parameters(), lr = learning_rate)

for epoch in range(num_epoches):

print('current epoch = %d' % epoch)

for i, (images, labels) in enumerate(train_loader): #利用enumerate取出一个可迭代对象的内容

images = Variable(images.view(images.size(0), -1))

labels = Variable(labels)

optimizer.zero_grad()

outputs = net(images)

loss = criterion(outputs, labels)

loss.backward()

optimizer.step()

if i % 100 == 0:

print('current loss = %.5f' % loss.item())

print('Finished training')

4.测试集准确度测试测试集准确度的测试代码具体如下：

#做prediction

total = 0

correct = 0

for images, labels in test_loader:

images = Variable(images.view(images.size(0), -1))

outputs = net(images)

_, predicts = torch.max(outputs.data, 1)

total += labels.size(0)

correct += (predicts == labels).sum()

print('Accuracy = %.2f' % (100 * correct / total))

由输出结果可知，准确度比较低，只有49%。

我们可以看出，浅层神经网络可以解决一部分简单的问题（在只有单通道的MNIST数据集上表现良好），但对于稍微复杂一些的彩色Cifar10数据集则表现很差。

在接下来，我们将进一步使用深度卷积神经网络实现Cifar10数据集的分类。

人工智能00038 深度学习与图像识别书评38 PyTorch实

猜你喜欢

热点阅读