具有RNN维数失配问题的张量流抽样软最大损失我有一个可变序列长度的多对一RNN的实现(一个句子分类问题) 我正在尝试实现一个抽样softmax损失,因为我有500节课,并希望加快培训。你知道吗 以下是我的输入参数形状 WLast.shape T ...2024-05-15 已阅读: n次