如何使ner\u crf停止添加空格?

2024-04-24 09:55:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经把rasa\u nlu集成到我的python应用程序中了。我将向它传递一个字符集,在本例中是${webAddress},我希望将该字符集作为一个实体返回。出于某种原因,ner\u crf在实体值中添加空格,即使它不在响应文本中。我怎样才能让它停止那样做?你知道吗

我在用spacy\u sklearn管道进行训练。我将其展开以指定各个组件,但我找不到任何关于如何配置各个组件的信息。我在我的训练数据中包含了非常相似的例子(用其他字符串代替webAddress),它确实识别了实体。只是…只是…停止用空格!你知道吗

$ curl -XPOST localhost:5000/parse -d '{"q":"navigate to ${webAddress}"}'
{
  "intent": {
    "name": "navigate",
    "confidence": 0.1911308126544064
  },
  "entities": [
    {
      "start": 12,
      "end": 25,
      "value": "$ { webaddress }",
      "entity": "url",
      "confidence": 0.5229620578330448,
      "extractor": "ner_crf"
    }
  ],
  "text": "navigate to ${webAddress}",
  "project": "default",
  "model": "model_20190409-153615"
}

Tags: to实体应用程序model组件空格confidencecrf