TensorFlow之矩阵初始化
2018-10-13 本文已影响0人
逆风g
用TensorFlow训练网络时,经常需要初始化指定内容的矩阵,所以这里把常用的初始化方法总结出来。其它平台例如Caffe、PyTorch都能用到这里的思想,方法都是类似的,还有常用的numpy库也是一样的,重要的是理解。
tf.ones(shape, dtype=dtypes.float32, name=None)
tf.zeros(shape, dtype=dtypes.float32, name=None)
tf.ones_like(tensor, dtype=None, name=None, optimize=True)
tf.zeros_like(tensor, dtype=None, name=None, optimize=True)
tf.fill(dims, value, name=None)
tf.constant(value, dtype=None, shape=None, name="Const", verify_shape=False)
tf.random_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)
tf.truncated_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)
tf.random_uniform(shape, minval=0, maxval=None, dtype=tf.float32, seed=None, name=None)
tf.lin_space(start, stop, num, name=None)
tf.range(start, limit=None, delta=1, dtype=None, name="range")
- 实战演示:初始化指定内容的矩阵
- tf.ones(shape, dtype=dtypes.float32, name=None)
生成指定shape
的矩阵,并且所有元素设置为1
,dtype
为元素类型,name
为操作名
a = tf.ones([3, 3], dtype=tf.float32)
# a
[[1. 1. 1.]
[1. 1. 1.]
[1. 1. 1.]]
- tf.zeros(shape, dtype=dtypes.float32, name=None)
和tf.ones
方法类似,区别是这里元素的值为0
a = tf.zeros([3, 3], dtype=tf.float32)
# a
[[0. 0. 0.]
[0. 0. 0.]
[0. 0. 0.]]
- tf.ones_like(tensor, dtype=None, name=None, optimize=True)
生成和tensor
同样纬度的矩阵,里面所有元素的值为1
a = tf.zeros([3, 3], dtype=tf.float32)
b = tf.ones_like(a, dtype=tf.float32)
# b
[[1. 1. 1.]
[1. 1. 1.]
[1. 1. 1.]]
- tf.zeros_like(tensor, dtype=None, name=None, optimize=True)
生成和tensor
同样纬度的矩阵,里面所有元素的值为0
a = tf.zeros([3, 3], dtype=tf.float32)
b = tf.zeros_like(a, dtype=tf.float32)
# b
[[0. 0. 0.]
[0. 0. 0.]
[0. 0. 0.]]
- tf.fill(dims, value, name=None)
生成指定dims
的矩阵,里面所有元素的值为value
a = tf.fill([3, 3], value=4.2)
# a
[[4.2 4.2 4.2]
[4.2 4.2 4.2]
[4.2 4.2 4.2]]
- tf.constant(value, dtype=None, shape=None, name="Const", verify_shape=False)
生成指定shape
的矩阵,里面所有元素的值为value
a = tf.constant(2.43, shape=[3, 3], dtype=tf.float32)
# a
[[2.43 2.43 2.43]
[2.43 2.43 2.43]
[2.43 2.43 2.43]]
- tf.random_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)
生成指定shape
的矩阵,里面元素的值根据正太分布随机生成,均值为mean
,标准差为stddev
a = tf.random_normal([3, 3], mean=0.0, stddev=0.01, dtype=tf.float32)
# a
[[-0.00026409 0.00167667 0.00082298]
[-0.00243075 0.00028445 -0.00075869]
[-0.00117088 -0.00071627 0.00053847]]
- tf.truncated_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)
和tf.random_normal
类似,不过只保留[mean-2×stddev,mean+2×stddev]范围内的随机数(截断正太分布)
a = tf.truncated_normal([3, 3], mean=0.0, stddev=0.01, dtype=tf.float32)
# a
[[-0.01347977 -0.00999547 0.01337798]
[-0.00836908 0.01384447 0.00581075]
[-0.00498486 0.01045679 0.01335113]]
- tf.random_uniform(shape, minval=0, maxval=None, dtype=tf.float32, seed=None, name=None)
生成指定shape
的矩阵,里面元素的值根据均匀分布随机生成,最小值为minval
,最大值为maxval
a = tf.truncated_normal([3, 3], mean=0.0, stddev=0.01, dtype=tf.float32)
# a
[[ 1.1490831 -2.8746405 7.5371017]
[ 7.1122856 5.787224 -0.5598779]
[-1.5815 -1.5148981 -0.3834536]]
- tf.lin_space(start, stop, num, name=None)
生成等差数列,起始值为start
,结束值为stop
,共取num
个值,虽然不是矩阵,但是我们可以通过reshape转换成矩阵
a = tf.lin_space(0.0, 6.0, 5)
# a
[0. 1.5 3. 4.5 6. ]
- tf.range(start, limit=None, delta=1, dtype=None, name="range")
生成等差数列,起始值为start
,结束值为stop
,以间隔delta
取值,虽然不是矩阵,但是我们可以通过reshape转换成矩阵
a = tf.range(0, 6, 1, dtype=tf.float32)
# a
[0. 1. 2. 3. 4. 5.]
- 把一个tensor转换成一张RGBA的图片,这张图片为纯黑色,如何初始化一个3维的tensor?
import tensorflow as tf
from PIL import Image
a = tf.constant([0, 0, 0, 255], dtype=tf.uint8)
b = tf.tile(a, [128 * 256])
c = tf.reshape(b, [128, 256, 4])
with tf.Session() as sess:
d = sess.run(c)
image = Image.fromarray(d)
image.show()
image.close()
print sess.run(c)