我一直在遵循这个指南。例如,我想实现XLNetTokenizer来生成子词。指南上显示的是英语,但有德语的对应词吗
from transformers import XLNetTokenizer
tokenizer = XLNetTokenizer.from_pretrained("xlnet-base-cased")
此代码段是为英语编写的。对于德语,有https://huggingface.co/bert-base-german-cased,但是我特别想尝试一下XLNEt生成的句子片段标记,因为句子片段嵌入似乎是最好的
您是否尝试加载XLMTokenizer的
English / German
版本相关问题 更多 >
编程相关推荐