数字的特定格式是匹配的

2024-05-23 16:02:14 发布

您现在位置:Python中文网/ 问答频道 /正文

Rasa NLU版本:0.12.3

操作系统(windows、osx等):Ubuntu 18.04

模型配置文件内容:

language: "en"


pipeline:
- name: "intent_featurizer_count_vectors"
- name: "intent_classifier_tensorflow_embedding"
  intent_tokenization_flag: true
  intent_split_symbol: "_"

问题:

我的意向培训数据包括以下数据

{{firstName | limito:7}{{名字。长度>;7?'…':''}}

一旦在测试过程中对数据进行了培训,该意图就与2018年7月20日的输入相匹配


Tags: 数据name模型版本内容pipelineubuntuwindows
1条回答
网友
1楼 · 发布于 2024-05-23 16:02:14

有一些典型的问题,知道答案很有用,比如:

  • 你有多少训练数据?你知道吗
  • 你有多少意图?你知道吗
  • 意图有多相似?你知道吗

但我认为在你的情况下,至少有两件事对你不利:

  • 你正在使用的羽化器将数字集在一起。参见代码中的注释:

    Creates bag-of-words representation of intent features using sklearn's `CountVectorizer`. All tokens which consist only of digits (e.g. 123 and 99 but not ab12d) will be represented by a single feature."""

  • 标记器或多或少基于空格:

    "token_pattern": r'(?u)\b\w\w+\b'

也要记住,拉萨NLU将永远选择一个意图。所以你也应该关注信心。也许输入的可信度足够低,您可以添加一个阈值来回退到某种固定响应。你知道吗

您能否为两个给定的示例提供预期的意图和实体?你知道吗

相关问题 更多 >