如何恢复BERT/XLNet嵌入？

bert = transformers.BertForMaskedLM.from_pretrained("bert-base-cased") tok = transformers.BertTokenizer.from_pretrained("bert-base-cased") sent = torch.tensor(tok.encode("I went to the store the other day, it was very rewarding.")) enc = bert.get_input_embeddings()(sent) dec = bert.get_output_embeddings()(enc) print(tok.decode(dec.softmax(-1).argmax(-1)))

1条回答

网友

1楼 · 发布于 2024-05-15 15:25:36

不确定是否为时已晚，但我已经对您的代码进行了一些实验，它可以恢复。：）

bert = transformers.BertForMaskedLM.from_pretrained("bert-base-cased")
tok = transformers.BertTokenizer.from_pretrained("bert-base-cased")

sent = torch.tensor(tok.encode("I went to the store the other day, it was very rewarding."))
print("Initial sentence:", sent)
enc = bert.get_input_embeddings()(sent)
dec = bert.get_output_embeddings()(enc)

print("Decoded sentence:", tok.decode(dec.softmax(0).argmax(1)))

为此，您将获得以下输出：

Initial sentence: tensor([  101,   146,  1355,  1106,  1103,  2984,  1103,  1168,  1285,   117,
         1122,  1108,  1304, 10703,  1158,   119,   102])  
Decoded sentence: [CLS] I went to the store the other day, it was very rewarding. [SEP]

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何恢复BERT/XLNet嵌入？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >