人工智能安全第一次作业

2021-10-10 本文已影响0人青漾

使Pytorch 训练一个深度学习网络

朱心洲 22151326

网络结构：卷积神经网络（CNN）
使用数据集：FER2013
运行方式:
正确率：60%+
所选框架：Pytorch
模型训练平台：Google Colab
完成日期： 2021.10.10

1. 作业介绍：

Creating your own github account.
Implementing your own deep neural network (in Pytorch, PaddlePaddle...).
Training it on CIFAR10.
Tuning a hyper-parameter and analyzing its effects on performance.Writing a README.md to report your findings

2. 实现过程：

2.1 数据集的导入

from torchvision import datasets,transforms
'''
CIFAR-10是kaggle计算机视觉竞赛的一个图像分类项目。
该数据集共有60000张32*32彩色图像，一共可以分为"plane", “car”, “bird”,“cat”, “deer”, “dog”, “frog”,“horse”,“ship”, “truck” 10类，
每类6000张图。有50000张用于训练，构成了5个训练批，每一批10000张图；10000张用于测试，单独构成一批。
tarnsform_fun=transforms.Compose([transforms.Pad(4),transforms.Resize((32,32)),transforms.ToTensor(),transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5])])
#一般用Compose把多个步骤整合到一起
#1.缩放图片，变成32*32
#2.归一化至0-1
#3.归一化到-1，1``input[channel] = (input[channel] - mean[channel]) / std[channel]``
training_data=datasets.CIFAR10(root='./data',train=True,download=True,transform=tarnsform_fun)

validation_data=datasets.CIFAR10(root='./data',train=False,download=True,transform=tarnsform_fun)
train_loader = torch.utils.data.DataLoader(dataset=training_data, batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=validation_data, batch_size=batch_size, shuffle=False)

CIFAR-10为33232的彩色图片，如下图所示

部分图片

2.2 定义一些超参数

#定义hyper-parameter
num_epochs = 10
num_classes = 10
batch_size = 32
learning_rate = 0.1

2.3 构建网络

数据集数据较复杂，特征较难提取，使用卷积神经网络实现，

两个卷积层
class CNN(nn.Module):
   def __init__(self, num_classes=10):
       super(CNN, self).__init__()
       self.conv1 = nn.Sequential(
           # 卷积核5*5
           nn.Conv2d(3, 16, kernel_size=5, stride=1, padding=2),
           #  批归一化
           nn.BatchNorm2d(16),
           #ReLU激活函数
           nn.ReLU(),
           # 池化层：最大池化
           nn.MaxPool2d(kernel_size=2, stride=2))
       
       self.conv2 = nn.Sequential(
           nn.Conv2d(16, 32, kernel_size=5, stride=1, padding=2),
           nn.BatchNorm2d(32),
           nn.ReLU(),
           nn.MaxPool2d(kernel_size=2, stride=2))
       
       self.fc = nn.Linear(8*8*32, num_classes)
       
   # 定义前向传播顺序
   def forward(self, x):
       out = self.conv1(x)
       out = self.conv2(out)
       out = out.reshape(out.size(0), -1)
       out = self.fc(out)
       return out

定义损失函数和优化器

criterion = nn.CrossEntropyLoss()
'''
交叉熵主要是用来判定实际的输出与期望的输出的接近程度，为什么这么说呢，
举个例子：在做分类的训练的时候，如果一个样本属于第K类，那么这个类别所对应的的输出节点的输出值应该为1，
而其他节点的输出都为0，即[0,0,1,0,….0,0]，这个数组也就是样本的Label，
是神经网络最期望的输出结果。也就是说用它来衡量网络的输出与标签的差异，利用这种差异经过反向传播去更新网络参数。
'''
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

### 2.4 模型的训练
读入数据集，对模型进行训练

for i, (images, labels) in enumerate(train_loader):
# 注意模型在GPU中，数据也要搬到GPU中
images = images.to(device)
labels = labels.to(device)

    # 前向传播
    outputs = model(images)
    loss = criterion(outputs, labels)
    
    # 反向传播和优化
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

### 2.5 相应结果可视化
将训练损失，校验集损失，训练准确率，校验准确率通过折线图的方式绘出
![实验结果(调参前)](https://img.haomeiwen.com/i16487280/ae186586dacbd85f.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
_通过计算，在10轮训练结束后，训练准确率在39%，测试集准确率在43%_

##3. 超参数的调整
### 3.1 学习率的调整
通过分析，训练过程中有过拟合的迹象，学习率可能过高，因此，调整学习率至0.001，调整学习率后，重新训练，评估模型

learning_rate = 0.001

在调整学习率后，训练结果有明显优化，如下图所示。
![训练结果（调整学习率后）](https://img.haomeiwen.com/i16487280/4fcc5467517f2342.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
__在5轮训练后，训练准确率在68%，测试集准确率在66%_
### 3.2 网络层数的调整