10、模型概览与一个实例

2020-12-15 本文已影响0人是黄小胖呀

一、模型概览

#基本概念

#0Keras 有两个重要的概念：模型（Model）和层（Layer）

#1层将各种计算流程和变量进行了封装（例如基本的全连接层，CNN 的卷积层、池化层等）

#2模型则将各种层进行组织和连接，并封装成一个整体，描述了如何将输入数据通过各种层以及运算而得到输出。

#3Keras 在 tf.keras.layers 下内置了深度学习中大量常用的的预定义层，同时也允许我们自定义层。

#4Keras 模型以类的形式呈现，我们可以通过继承 tf.keras.Model 这个 Python 类来定义自己的模型。

#5在继承类中，我们需要重写 init() （构造函数，初始化）和 call(input) （模型调用）两个方法，同时也可以根据需要增加自> 定义的方法。

class MyModel(tf.keras.Model):

def __init__(self):

super().__init__() # Python 2 下使用 super(MyModel, self).__init__()

# 此处添加初始化代码（包含 call 方法中会用到的层），例如

# layer1 = tf.keras.layers.BuiltInLayer(...)

# layer2 = MyCustomLayer(...)

def call(self, input):

# 此处添加模型调用的代码（处理输入并返回输出），例如

# x = layer1(input)

# output = layer2(x)

return output

# 还可以添加自定义的方法

模型图示

例子：

import tensorflow as tf

X = tf.constant([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])

y = tf.constant([[10.0], [20.0]])

class Linear(tf.keras.Model):

def __init__(self):

super().__init__()

self.dense = tf.keras.layers.Dense(

units=1,

activation=None,

kernel_initializer=tf.zeros_initializer(),

bias_initializer=tf.zeros_initializer()

)

def call(self, input):

output = self.dense(input)

return output

# 以下代码结构与前节类似

model = Linear()

optimizer = tf.keras.optimizers.SGD(learning_rate=0.01)

for i in range(100):

with tf.GradientTape() as tape:

y_pred = model(X) # 调用模型 y_pred = model(X) 而不是显式写出 y_pred = a * X + b

loss = tf.reduce_mean(tf.square(y_pred - y))

grads = tape.gradient(loss, model.variables) # 使用 model.variables 这一属性直接获得模型中的所有变量

optimizer.apply_gradients(grads_and_vars=zip(grads, model.variables))

print(model.variables)

1、我们没有显式地声明 a 和 b 两个变量并写出 y_pred = a X + b 这一线性变换，而是建立了一个继承了 tf.keras.Model 的模型类 Linear 。这个类在初始化部分实例化了一个 *全连接层 （ tf.keras.layers.Dense ），并在 call 方法中对这个层进行调用，实现了线性变换的计算。

2、Keras 的全连接层：线性变换 + 激活函数

全连接层

主要参数

3、为什么模型类是重载 call() 方法而不是 call() 方法？

在 Python 中，对类的实例 myClass 进行形如 myClass() 的调用等价于 myClass.call() （具体请见本章初 “前置知识” 的 call() 部分）。那么看起来，为了使用 ypred = model(X) 的形式调用模型类，应该重写 call() 方法才对呀？原因是 Keras 在模型调用的前后还需要有一些自己的内部操作，所以暴露出一个专门用于重载的 call() 方法。 tf.keras.Model 这一父类已经包含 call() 的定义。 _call() 中主要调用了 call() 方法，同时还需要在进行一些 keras 的内部操作。这里，我们通过继承 tf.keras.Model 并重载 call() 方法，即可在保持 keras 结构的同时加入模型调用的代码。

二、一个实例：使用多层感知机完成 MNIST 手写体数字图片数据集 [LeCun1998] 的分类任务。

模型的构建： tf.keras.Model 和 tf.keras.layers

多层感知机的模型类实现与上面的线性模型类似，使用 tf.keras.Model 和 tf.keras.layers 构建，所不同的地方在于层数增加了（顾名思义，“多层” 感知机），以及引入了非线性激活函数（这里使用了 ReLU 函数，即下方的 activation=tf.nn.relu ）。该模型输入一个向量（比如这里是拉直的 1×784 手写体数字图片），输出 10 维的向量，分别代表这张图片属于 0 到 9 的概率。

代码主要分为几个部分：

1、引入/导入包

2、定义训练数据处理

3、定义模型

4、进行训练

5、评估结果

代码如下：它跑成功了呀~~~

10 import tensorflow as tf

11import numpy as np

13 class MNISTLoader():

14 def __init__(self):

15 mnist = tf.keras.datasets.mnist

16 (self.train_data, self.train_label), (self.test_data, self.test_label) = mnist.load_data()

17 # MNIST中的图像默认为uint8（0-255的数字）。以下代码将其归一化到0-1之间的浮点数，并在最后增加一维作为颜色通道

18 self.train_data = np.expand_dims(self.train_data.astype(np.float32) /255.0, axis=-1) # [60000, 28, 28, 1]

19 self.test_data = np.expand_dims(self.test_data.astype(np.float32) /255.0, axis=-1) # [10000, 28, 28, 1]

20 self.train_label = self.train_label.astype(np.int32) # [60000]

21 self.test_label = self.test_label.astype(np.int32) # [10000]

22 self.num_train_data, self.num_test_data = self.train_data.shape[0], self.test_data.shape[0]

24 def get_batch(self, batch_size):

25 # 从数据集中随机取出batch_size个元素并返回

26 index = np.random.randint(0, np.shape(self.train_data)[0], batch_size)

27 return self.train_data[index, :], self.train_label[index]

29 class MLP(tf.keras.Model):

30 def __init__(self):

31 super().__init__()

32 self.flatten = tf.keras.layers.Flatten() # Flatten层将除第一维（batch_size）以外的维度展平

33 self.dense1 = tf.keras.layers.Dense(units=100, activation=tf.nn.relu)

34 self.dense2 = tf.keras.layers.Dense(units=10)

36 def call(self, inputs): # [batch_size, 28, 28, 1]

37 x = self.flatten(inputs) # [batch_size, 784]

38 x = self.dense1(x) # [batch_size, 100]

39 x = self.dense2(x) # [batch_size, 10]

40 output = tf.nn.softmax(x)

41 return output

43num_epochs = 5

44batch_size = 50

45learning_rate = 0.001

47model = MLP()

48data_loader = MNISTLoader()

49optimizer = tf.keras.optimizers.Adam(learning_rate=learning_rate)

51num_batches = int(data_loader.num_train_data // batch_size * num_epochs)

52 for batch_index in range(num_batches):

53 X, y = data_loader.get_batch(batch_size)

54 with tf.GradientTape() as tape:

55 y_pred = model(X)

56 loss = tf.keras.losses.sparse_categorical_crossentropy(y_true=y, y_pred=y_pred)

57 loss = tf.reduce_mean(loss)

58 print("batch %d: loss %f" % (batch_index, loss.numpy()))

59 grads = tape.gradient(loss, model.variables)

60 optimizer.apply_gradients(grads_and_vars=zip(grads, model.variables))

62sparse_categorical_accuracy = tf.keras.metrics.SparseCategoricalAccuracy()

63num_batches = int(data_loader.num_test_data // batch_size)

64 for batch_index in range(num_batches):

65 start_index, end_index = batch_index * batch_size, (batch_index +1) * batch_size

66 y_pred = model.predict(data_loader.test_data[start_index: end_index])

67 sparse_categorical_accuracy.update_state(y_true=data_loader.test_label[start_index: end_index], y_pred=y_pred)

68print("test accuracy: %f" % sparse_categorical_accuracy.result())

参考资料

1、简单粗暴 TensorFlow 2.0 模型（Model）与层（Layer）

https://www.bookstack.cn/read/TensorFlow2.0/spilt.1.c868281a01ad8ec0.md

2、简单粗暴 TensorFlow 2.0 基础示例：多层感知机（MLP）

https://www.bookstack.cn/read/TensorFlow2.0/spilt.2.c868281a01ad8ec0.md

10、模型概览与一个实例

猜你喜欢

热点阅读