Pytorch NLP模型在进行推理时不使用GPU

from transformers import AutoTokenizer, AutoModelForQuestionAnswering, pipeline import torch BERT_DIR = "savasy/bert-base-turkish-squad" tokenizer = AutoTokenizer.from_pretrained(BERT_DIR) model = AutoModelForQuestionAnswering.from_pretrained(BERT_DIR) nlp=pipeline("question-answering", model=model, tokenizer=tokenizer) def infer(question,corpus): try: ans = nlp(question=question, context=corpus) return ans["answer"], ans["score"] except: ans = None pass return None, 0

2条回答

网友

1楼 · 编辑于 2024-05-16 10:10:39

要使模型在GPU上工作，必须将数据和模型加载到GPU：

您可以按如下方式执行此操作：

from transformers import AutoTokenizer, AutoModelForQuestionAnswering, pipeline
import torch

BERT_DIR = "savasy/bert-base-turkish-squad"  
  
device = torch.device("cuda")

tokenizer = AutoTokenizer.from_pretrained(BERT_DIR)
model = AutoModelForQuestionAnswering.from_pretrained(BERT_DIR)
model.to(device) ## model to GPU

nlp=pipeline("question-answering", model=model, tokenizer=tokenizer)


def infer(question,corpus):
    try:
        ans = nlp(question=question.to(device), context=corpus.to(device)) ## data to GPU
        return ans["answer"], ans["score"]
    except:
        ans = None
        pass

    return None, 0

网友

2楼 · 编辑于 2024-05-16 10:10:39

使用包含设备参数的加载管道解决了该问题：

nlp = pipeline("question-answering", model=BERT_DIR, device=0)

相关问题更多 >

编程相关推荐

热门问题

热门文章