深度学习

TensorFlow之矩阵初始化

2018-10-13  本文已影响0人  逆风g

用TensorFlow训练网络时,经常需要初始化指定内容的矩阵,所以这里把常用的初始化方法总结出来。其它平台例如Caffe、PyTorch都能用到这里的思想,方法都是类似的,还有常用的numpy库也是一样的,重要的是理解。

  1. tf.ones(shape, dtype=dtypes.float32, name=None)
  2. tf.zeros(shape, dtype=dtypes.float32, name=None)
  3. tf.ones_like(tensor, dtype=None, name=None, optimize=True)
  4. tf.zeros_like(tensor, dtype=None, name=None, optimize=True)
  5. tf.fill(dims, value, name=None)
  6. tf.constant(value, dtype=None, shape=None, name="Const", verify_shape=False)
  7. tf.random_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)
  8. tf.truncated_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)
  9. tf.random_uniform(shape, minval=0, maxval=None, dtype=tf.float32, seed=None, name=None)
  10. tf.lin_space(start, stop, num, name=None)
  11. tf.range(start, limit=None, delta=1, dtype=None, name="range")
  12. 实战演示:初始化指定内容的矩阵
  1. tf.ones(shape, dtype=dtypes.float32, name=None)

生成指定shape的矩阵,并且所有元素设置为1dtype为元素类型,name为操作名

a = tf.ones([3, 3], dtype=tf.float32)
# a
[[1. 1. 1.]
 [1. 1. 1.]
 [1. 1. 1.]]
  1. tf.zeros(shape, dtype=dtypes.float32, name=None)

tf.ones方法类似,区别是这里元素的值为0

a = tf.zeros([3, 3], dtype=tf.float32)
# a
[[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]
  1. tf.ones_like(tensor, dtype=None, name=None, optimize=True)

生成和tensor同样纬度的矩阵,里面所有元素的值为1

a = tf.zeros([3, 3], dtype=tf.float32)
b = tf.ones_like(a, dtype=tf.float32)
# b
[[1. 1. 1.]
 [1. 1. 1.]
 [1. 1. 1.]]
  1. tf.zeros_like(tensor, dtype=None, name=None, optimize=True)

生成和tensor同样纬度的矩阵,里面所有元素的值为0

a = tf.zeros([3, 3], dtype=tf.float32)
b = tf.zeros_like(a, dtype=tf.float32)
# b
[[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]
  1. tf.fill(dims, value, name=None)

生成指定dims的矩阵,里面所有元素的值为value

a = tf.fill([3, 3], value=4.2)
# a
[[4.2 4.2 4.2]
 [4.2 4.2 4.2]
 [4.2 4.2 4.2]]
  1. tf.constant(value, dtype=None, shape=None, name="Const", verify_shape=False)

生成指定shape的矩阵,里面所有元素的值为value

a = tf.constant(2.43, shape=[3, 3], dtype=tf.float32)
# a
[[2.43 2.43 2.43]
 [2.43 2.43 2.43]
 [2.43 2.43 2.43]]
  1. tf.random_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)

生成指定shape的矩阵,里面元素的值根据正太分布随机生成,均值为mean,标准差为stddev

a = tf.random_normal([3, 3], mean=0.0, stddev=0.01, dtype=tf.float32)
# a
[[-0.00026409  0.00167667  0.00082298]
 [-0.00243075  0.00028445 -0.00075869]
 [-0.00117088 -0.00071627  0.00053847]]
  1. tf.truncated_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)

tf.random_normal类似,不过只保留[mean-2×stddev,mean+2×stddev]范围内的随机数(截断正太分布)

a = tf.truncated_normal([3, 3], mean=0.0, stddev=0.01, dtype=tf.float32)
# a
[[-0.01347977 -0.00999547  0.01337798]
 [-0.00836908  0.01384447  0.00581075]
 [-0.00498486  0.01045679  0.01335113]]
  1. tf.random_uniform(shape, minval=0, maxval=None, dtype=tf.float32, seed=None, name=None)

生成指定shape的矩阵,里面元素的值根据均匀分布随机生成,最小值为minval,最大值为maxval

a = tf.truncated_normal([3, 3], mean=0.0, stddev=0.01, dtype=tf.float32)
# a
[[ 1.1490831 -2.8746405  7.5371017]
 [ 7.1122856  5.787224  -0.5598779]
 [-1.5815    -1.5148981 -0.3834536]]
  1. tf.lin_space(start, stop, num, name=None)

生成等差数列,起始值为start,结束值为stop,共取num个值,虽然不是矩阵,但是我们可以通过reshape转换成矩阵

a = tf.lin_space(0.0, 6.0, 5)
# a
[0.  1.5 3.  4.5 6. ]
  1. tf.range(start, limit=None, delta=1, dtype=None, name="range")

生成等差数列,起始值为start,结束值为stop,以间隔delta取值,虽然不是矩阵,但是我们可以通过reshape转换成矩阵

a = tf.range(0, 6, 1, dtype=tf.float32)
# a
[0. 1. 2. 3. 4. 5.]
  1. 把一个tensor转换成一张RGBA的图片,这张图片为纯黑色,如何初始化一个3维的tensor?
import tensorflow as tf
from PIL import Image

a = tf.constant([0, 0, 0, 255], dtype=tf.uint8)
b = tf.tile(a, [128 * 256])
c = tf.reshape(b, [128, 256, 4])
with tf.Session() as sess:
    d = sess.run(c)
    image = Image.fromarray(d)
    image.show()
    image.close()
    print sess.run(c)
上一篇 下一篇

猜你喜欢

热点阅读