Python找不到春的图案

2024-03-28 20:52:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试提取像这样的POS标签的特殊块和许多块 不同的模式很好用,相似的句子可以用他们。但是当我看到我在标签词中定义的标签的确切序列作为chunk输出时,问题就出现了,但是机器找不到具有我的名称的标签已定义。示例地址:

{<VB><RB.?><VB><NN.?>+<IN>*<JJ.?>*<NN.?>*} 

很容易找到这样一句话:

Do not take money from internal relations

但当我有另一种模式时:

{<IN><DT>*<NN.?>+<VBZ><RB.?>*<JJ.?><CC>*<PRP$><NN.?>+<VBZ><JJ.?><TO><VB><CC>*<VBG><PRP><MD><VB>}

例如: 如果现在是不容易的,或者它的大小是难以量化的,但它会满足

无法检测它并将其显示为S只是。尽管如此我相信这种模式正是一样。可以吗这是因为我要找的从句有时在句首,有时在句中,有时在句尾?这是不是因为我用了punktstencetokenizer? 任何帮助都将不胜感激


Tags: inpos定义模式序列nn标签句子