在同一Tensorflow会话中从Saver加载两个模型

with tf.name_scope("model"): model = Model(args) with tf.name_scope("adv"): adversary = Adversary(adv_args) #... with tf.Session() as sess: tf.global_variables_initializer().run() # Get the variables specific to the `Model` # Also strip out the surperfluous ":0" for some reason not saved in the checkpoint model_varlist = {v.name.lstrip("model/")[:-2]: v for v in tf.global_variables() if v.name[:5] == "model"} model_saver = tf.train.Saver(var_list=model_varlist) model_ckpt = tf.train.get_checkpoint_state(args.save_dir) model_saver.restore(sess, model_ckpt.model_checkpoint_path) # Get the variables specific to the `Adversary` adv_varlist = {v.name.lstrip("avd/")[:-2]: v for v in tf.global_variables() if v.name[:3] == "adv"} adv_saver = tf.train.Saver(var_list=adv_varlist) adv_ckpt = tf.train.get_checkpoint_state(adv_args.save_dir) adv_saver.restore(sess, adv_ckpt.model_checkpoint_path)

3条回答

网友

1楼 · 编辑于 2024-05-23 16:34:50

请检查：

adv_varlist = {v.name.lstrip("avd/")[:-2]: v

应该是“adv”，不是吗

网友

2楼 · 编辑于 2024-05-23 16:34:50

标记为正确的答案并没有告诉我们如何将两个不同的模型显式加载到一个会话中，下面是我的答案：

为要加载的模型创建两个不同的名称作用域。
初始化两个保存程序，它们将加载两个不同网络中变量的参数。
从相应的检查点文件加载。

with tf.Session() as sess:
    with tf.name_scope("net1"):
      net1 = Net1()
    with tf.name_scope("net2"):
      net2 = Net2()

    net1_varlist = {v.op.name.lstrip("net1/"): v
                    for v in tf.get_collection(tf.GraphKeys.VARIABLES, scope="net1/")}
    net1_saver = tf.train.Saver(var_list=net1_varlist)

    net2_varlist = {v.op.name.lstrip("net2/"): v
                    for v in tf.get_collection(tf.GraphKeys.VARIABLES, scope="net2/")}
    net2_saver = tf.train.Saver(var_list=net2_varlist)

    net1_saver.restore(sess, "net1.ckpt")
    net2_saver.restore(sess, "net2.ckpt")

网友

3楼 · 编辑于 2024-05-23 16:34:50

解决这个问题花了很长时间，所以我发布了我可能不完美的解决方案，以防其他人需要它。

为了诊断这个问题，我手动循环遍历每个变量，并逐个分配它们。然后我注意到，分配变量后，名称会改变。这里是这样描述的：TensorFlow checkpoint save and read

根据那篇文章中的建议，我用自己的图表运行了每个模型。这也意味着我必须在它自己的会话中运行每个图。这意味着以不同的方式处理会话管理。

首先我创建了两个图

model_graph = tf.Graph()
with model_graph.as_default():
    model = Model(args)

adv_graph = tf.Graph()
with adv_graph.as_default():
    adversary = Adversary(adv_args)

然后是两会

adv_sess = tf.Session(graph=adv_graph)
sess = tf.Session(graph=model_graph)

然后我初始化每个会话中的变量，并分别还原每个图

with sess.as_default():
    with model_graph.as_default():
        tf.global_variables_initializer().run()
        model_saver = tf.train.Saver(tf.global_variables())
        model_ckpt = tf.train.get_checkpoint_state(args.save_dir)
        model_saver.restore(sess, model_ckpt.model_checkpoint_path)

with adv_sess.as_default():
    with adv_graph.as_default():
        tf.global_variables_initializer().run()
        adv_saver = tf.train.Saver(tf.global_variables())
        adv_ckpt = tf.train.get_checkpoint_state(adv_args.save_dir)
        adv_saver.restore(adv_sess, adv_ckpt.model_checkpoint_path)

从这里开始，每当需要每个会话时，我都会用with sess.as_default():包装该会话中的任何tf函数。最后，我手动关闭会话

sess.close()
adv_sess.close()

相关问题更多 >

编程相关推荐

热门问题

热门文章