2024-04-27 04:31:00 发布
网友
我试图从预训练的“DistilBERT”模型的几个不同层访问输出嵌入。(“迪斯蒂尔伯特基地无病”)
bert_output = model(input_ids, attention_mask=attention_mask)
bert_输出似乎只返回最后一层输入标记的嵌入值
如果希望获得所有隐藏层的输出,则需要将output_hidden_states=Truekwarg添加到配置中
output_hidden_states=True
您的代码看起来像
from transformers import DistilBertModel, DistilBertConfig config = DistilBertConfig.from_pretrained('distilbert-base-cased', output_hidden_states=True) model = DistilBertModel.from_pretrained('distilbert-base-cased', config=config)
隐藏层将作为bert_output[2]提供
bert_output[2]
如果希望获得所有隐藏层的输出,则需要将
output_hidden_states=True
kwarg添加到配置中您的代码看起来像
隐藏层将作为
bert_output[2]
提供相关问题 更多 >
编程相关推荐