如何在语言翻译中重新训练序列到序列的神经网络模型?

2024-06-02 04:52:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经训练了一个seq2seq tensorflow模型来将一个句子从英语翻译成西班牙语。我训练了一个615700步的模型,并成功地保存了模型检查点。我的英语和西班牙语句子的训练数据大小都是200000。我想重新训练这个模型,从615700个步骤中获得10K个新的数据语句。我用序列来序列tensoflow模型。如何从最后一个检查点开始重新培训模型?Here是我用来翻译的链接。你知道吗

我的train文件夹中有3种类型的文件:

.index
.meta
.data
and checkpoint file.

我的新训练数据集文件是europarl_train.es-en.eneuroparl_train.es-en.es,分别用于英语和西班牙语句子。你知道吗

我编写了一个代码来加载model.meta文件和权重

import data_utils
import seq2seq_model
import translate
import tensorflow as tf

with tf.Session() as sess:    
    saver = tf.train.import_meta_graph('/home/i9/L-T_Model_Training/16_NOV_MODEL/train/translate.ckpt-615700.meta')
    saver.restore(sess,tf.train.latest_checkpoint('/home/i9/L-T_Model_Training/16_NOV_MODEL/train/.'))

如何开始保留此数据集?你知道吗


Tags: 文件数据模型importdataestftensorflow