入门：拥抱人脸模型卡

2024-06-10 02:27:23 发布

男 | 程序猿一只，喜欢编程写python代码。

我最近刚开始研究huggingface transformer库。当我试图开始使用模型卡代码时，例如community model

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("emilyalsentzer/Bio_ClinicalBERT")
model = AutoModel.from_pretrained("emilyalsentzer/Bio_ClinicalBERT")

但是，我得到了以下错误：

Traceback (most recent call last):
  File "test.py", line 2, in <module>
    tokenizer = AutoTokenizer.from_pretrained("emilyalsentzer/Bio_ClinicalBERT")
  File "/Users/Lukas/miniconda3/envs/nlp/lib/python3.7/site-packages/transformers/tokenization_auto.py", line 124, in from_pretrained
    "'xlm', 'roberta', 'ctrl'".format(pretrained_model_name_or_path))
ValueError: Unrecognized model identifier in emilyalsentzer/Bio_ClinicalBERT. Should contains one of 'bert', 'openai-gpt', 'gpt2', 'transfo-xl', 'xlnet', 'xlm', 'roberta', 'ctrl'

如果我尝试不同的标记器，例如“baykenney/bert-base-gpt2detector-topp92”，我会得到以下错误：

OSError: Model name 'baykenney/bert-base-gpt2detector-topp92' was not found in tokenizers model name list (bert-base-uncased, bert-large-uncased, bert-base-cased, bert-large-cased, bert-base-multilingual-uncased, bert-base-multilingual-cased, bert-base-chinese, bert-base-german-cased, bert-large-uncased-whole-word-masking, bert-large-cased-whole-word-masking, bert-large-uncased-whole-word-masking-finetuned-squad, bert-large-cased-whole-word-masking-finetuned-squad, bert-base-cased-finetuned-mrpc, bert-base-german-dbmdz-cased, bert-base-german-dbmdz-uncased). We assumed 'baykenney/bert-base-gpt2detector-topp92' was a path or url to a directory containing vocabulary files named ['vocab.txt'] but couldn't find such vocabulary files at this path or url.

我有没有错过任何开始的机会？我觉得模型卡表明这三行代码应该足够开始了

我使用的是Python 3.7和transformer库版本2.1.1以及pytorch 1.5

Tags： in from base model word bio bert large

1条回答

网友

1楼 · 发布于 2024-06-10 02:27:23

请将变形金刚库至少更新为2.4.0。您应该创建一个新的conda环境，并使用pip直接从pypi安装所有软件包，以获得最新版本（当前为2.11.0）

入门：拥抱人脸模型卡

相关问题更多 >

编程相关推荐

热门问题

热门文章

入门：拥抱人脸模型卡

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >