tensorflow 分布式启动
2019-02-12 本文已影响4人
a十二_4765
import tensorflow as tf
#1配置服务器相关信息
#因为tensorflow 底层代码中,默认就是使用ps和work分别表示俩类不同的工作节点
#ps:变量/张量的初始化,存储相关的节点
#work:变量/张量的计算/运算的相关节点
ps_hosts = ['127.0.0.1:33331','127.0.0.1:33332']
work_hosts =['127.0.0.1:33333','127.0.0.1:33334','127.0.0.1:33335']
cluster = tf.train.ClusterSpec({'ps':ps_hosts,'work':work_hosts})
#2.定义一些运行参数 job_name 属性名称
tf.app.flags.DEFINE_string('jon_name',default_value='work',docstring="One of 'ps' or 'work'")
tf.app.flags.DEFINE_integer('task_index',default_value=0,docstring="Index of task within the job")
FLAGS = tf.app.flags.FLAGS
#2.启动服务
def main():
print(FLAGS.job_name)
server = tf.train.Server(cluster,job_name=FLAGS.jon_name,task_index=FLAGS.task_index)
server.join()
if __name__ =='__main__':
tf.app.run()