我正在尝试提取像这样的POS标签的特殊块和许多块 不同的模式很好用,相似的句子可以用他们。但是当我看到我在标签词中定义的标签的确切序列作为chunk输出时,问题就出现了,但是机器找不到具有我的名称的标签已定义。示例地址:
{<VB><RB.?><VB><NN.?>+<IN>*<JJ.?>*<NN.?>*}
很容易找到这样一句话:
Do not take money from internal relations
但当我有另一种模式时:
{<IN><DT>*<NN.?>+<VBZ><RB.?>*<JJ.?><CC>*<PRP$><NN.?>+<VBZ><JJ.?><TO><VB><CC>*<VBG><PRP><MD><VB>}
例如: 如果现在是不容易的,或者它的大小是难以量化的,但它会满足
无法检测它并将其显示为S只是。尽管如此我相信这种模式正是一样。可以吗这是因为我要找的从句有时在句首,有时在句中,有时在句尾?这是不是因为我用了punktstencetokenizer? 任何帮助都将不胜感激
目前没有回答
相关问题 更多 >
编程相关推荐