Rasa NLU版本:0.12.3
操作系统(windows、osx等):Ubuntu 18.04
模型配置文件内容:
language: "en"
pipeline:
- name: "intent_featurizer_count_vectors"
- name: "intent_classifier_tensorflow_embedding"
intent_tokenization_flag: true
intent_split_symbol: "_"
问题:
我的意向培训数据包括以下数据
{{firstName | limito:7}{{名字。长度>;7?'…':''}}
一旦在测试过程中对数据进行了培训,该意图就与2018年7月20日的输入相匹配
有一些典型的问题,知道答案很有用,比如:
但我认为在你的情况下,至少有两件事对你不利:
你正在使用的羽化器将数字集在一起。参见代码中的注释:
Creates bag-of-words representation of intent features using sklearn's `CountVectorizer`. All tokens which consist only of digits (e.g. 123 and 99 but not ab12d) will be represented by a single feature."""
标记器或多或少基于空格:
"token_pattern": r'(?u)\b\w\w+\b'
也要记住,拉萨NLU将永远选择一个意图。所以你也应该关注信心。也许输入的可信度足够低,您可以添加一个阈值来回退到某种固定响应。你知道吗
您能否为两个给定的示例提供预期的意图和实体?你知道吗
相关问题 更多 >
编程相关推荐