TensorFlow 基础笔记
TensorFlow
是 Google 开发的一款神经网络的 Python 外部的结构包,也是一个采用数据流图来进行数值计算的开源软件库。 TensorFlow
让我们可以先绘制计算结构图, 也可以称是一系列可人机交互的计算操作,然后把编辑好的 Python
文件 转换成 更高效的 C++
, 并在后端进行计算。
它擅长的任务就是训练深度神经网络。通过使用 TensorFlow 我们就可以快速的入门神经网络,大大降低了深度学习(也就是深度神经网络)的开发成本和开发难度.
Tensorflow 首先要定义神经网络的结构, 然后再把数据放入结构当中去运算和 training。因为TensorFlow是采用数据流图(data flow graphs)来计算, 所以首先我们得创建一个数据流流图, 然后再将我们的数据(数据以张量(tensor)的形式存在)放在数据流图中计算. 节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组, 即张量(tensor). 训练模型时 tensor 会不断的从数据流图中的一个节点 flow 到另一节点, 这就是 TensorFlow 名字的由来。
TensorFlow安装
Docker安装真方便.....QAQ....去看官网吧...懒.....
Tensorflow 的安装方式很多. 比如官网提供的:
张量(Tensor)
- 张量有多种. 零阶张量为 纯量或标量 (scalar) 也就是一个数值. 比如
[1]
- 一阶张量为 向量 (vector), 比如 一维的
[1, 2, 3]
- 二阶张量为 矩阵 (matrix), 比如 二维的
[[1, 2, 3],[4, 5, 6],[7, 8, 9]]
- 以此类推, 还有 三阶 三维的 ...
Session
Tensorflow 中的 Session
是 Tensorflow 为了控制,和输出文件的执行的语句,运行 session.run()
可以获得你要得知的运算结果, 或者是你所要运算的部分.
首先,我们这次需要加载 Tensorflow ,然后建立两个 matrix
,输出两个 matrix
矩阵相乘的结果。
import tensorflow as tf
# create two matrixes
matrix1 = tf.constant([[3,3]])
matrix2 = tf.constant([[2],
[2]])
product = tf.matmul(matrix1,matrix2)
因为 product
不是直接计算的步骤, 所以要使用 Session
来激活 product
并的到计算结果.
有两种形式使用会话控制 Session
。
# method 1
sess = tf.Session()
result = sess.run(product)
print(result)
sess.close()
# [[12]]
# method 2
with tf.Session() as sess:
result2 = sess.run(product)
print(result2)
# [[12]]
Variable
在 Tensorflow 中,定义了某字符串是变量,它才是变量,这一点是与 Python 所不同的。
定义语法: state = tf.Variable()
import tensorflow as tf
state = tf.Variable(0, name='counter')
# 定义常量 one
one = tf.constant(1)
## 定义加法步骤 (注: 此步并没有直接计算)
new_value = tf.add(state, one)
# 将 State 更新成 new_value
update = tf.assign(state, new_value)
如果你在 Tensorflow 中设定了变量,那么初始化变量是最重要的!!所以定义了变量以后,
一定要定义 init = tf.initialize_all_variables()
.
到这里变量还是没有被激活,需要再在 sess
里, sess.run(init)
, 激活 init
这一步.
# 如果定义 Variable, 就一定要 initialize
# init = tf.initialize_all_variables() # tf 马上就要废弃这种写法
init = tf.global_variables_initializer() # 替换成这样就好
# 使用 Session
with tf.Session() as sess:
sess.run(init)
for _ in range(3):
sess.run(update)
print(sess.run(state))
注意:直接 print(state)
不起作用!!
一定要把 sess
的指针指向 state
再进行 print
才能得到想要的结果!
Placeholder
Tensorflow 如果想要从外部传入data, 那就需要用到 tf.placeholder(), 然后在之后 sess.run(***, feed_dict={input: **})
的时候传入要输入的值.
示例:
import tensorflow as tf
#在 Tensorflow 中需要定义 placeholder 的 type ,一般为 float32 形式
input1 = tf.placeholder(tf.float32)
input2 = tf.placeholder(tf.float32)
# mul = multiply 是将input1和input2 做乘法运算,并输出为 output
ouput = tf.multiply(input1, input2)
接下来, 传值的工作交给了 sess.run()
, 需要传入的值放在了feed_dict={}
并一一对应每一个 input
.
placeholder
与 feed_dict={}
是绑定在一起出现的。
with tf.Session() as sess:
print(sess.run(ouput, feed_dict={input1: [7.], input2: [2.]}))
# [ 14.]
Activation Function
激励函数,他运行时激活神经网络中某一部分神经元,将激活信息向后传入下一层的神经系统。激励函数的实质是非线性方程。 Tensorflow 的神经网络 里面处理较为复杂的问题时都会需要运用激励函数 activation function
。
激励函数有很多种,针对不同问题,选取合适激励函数,更多见官网
知乎上有一个关于神经网络激励函数的作用的提问,回答的内容很实在.
添加层
在 Tensorflow 里定义一个添加层的函数可以很容易的添加神经层,为之后的添加省下不少时间.
神经层里常见的参数通常有weights
、biases
和激励函数。
首先,需要导入tensorflow
模块。
import tensorflow as tf
然后定义添加神经层的函数def add_layer()
,它有四个参数:输入值、输入的大小、输出的大小和激励函数,我们设定默认的激励函数是None
。
def add_layer(inputs, in_size, out_size, activation_function=None):
接下来,开始定义weights
和biases
。
因为在生成初始参数时,随机变量(normal distribution)会比全部为0要好很多,所以我们这里的weights
为一个in_size
行, out_size
列的随机变量矩阵。
Weights = tf.Variable(tf.random_normal([in_size, out_size]))
在机器学习中,biases
的推荐值不为0,所以我们这里是在0向量的基础上又加了0.1
。
biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)
下面,我们定义Wx_plus_b
, 即神经网络未激活的值。其中,tf.matmul()
是矩阵的乘法。
Wx_plus_b = tf.matmul(inputs, Weights) + biases
当activation_function
——激励函数为None
时,输出就是当前的预测值——Wx_plus_b
,不为None
时,就把Wx_plus_b
传到activation_function()
函数中得到输出。
if activation_function is None:
outputs = Wx_plus_b
else:
outputs = activation_function(Wx_plus_b)
最后,返回输出,添加一个神经层的函数——def add_layer()
就定义好了。
return outputs