品红注意:在训练中丢失

2024-04-16 21:38:55 发布

您现在位置:Python中文网/ 问答频道 /正文

这是在Google Magenta package的上下文中,特别是旋律RNN model。你知道吗

我试着用自己的数据集训练一个基本的检查点,结果很好,产生了一个可用的检查点。但是,当我尝试使用注意力时,通过将“attn\u length=40”添加到hparams,我得到了错误“NaN loss during training.”。我尝试过将attnèu length更改为其他值,如10或20,但仍然会出现此错误。另外,我确保使用“attention\rnn”参数创建数据集,这样就不会有问题了。你知道吗

有人有类似的问题吗?你知道吗

以下是我使用的命令:

convert_dir_to_note_sequences 
--input_dir=$INPUT_DIRECTORY 
--output_file=$SEQUENCES_TFRECORD 
--recursive

melody_rnn_create_dataset --config="attention_rnn" --input=".../mono_notesequences.tfrecord" --output_dir="..." --eval_ratio="0.10"

python ${MODEL}/melody_rnn_train.py --config=attention_rnn --run_dir=${OUTPUT} --sequence_example_file=${INPUT}/attention_rnn/training_melodies.tfrecord --hparams="batch_size=128,rnn_layer_sizes=[512,512],attn_length=40" --num_training_steps=20000

Tags: 数据inputoutput错误dirtraininglength检查点