我一直在使用pytextrank(https://github.com/DerwenAI/pytextrank/)和spacy和英语模型来提取关键词——它非常有效
现在我需要处理非英语文本,我找到了udpipe(https://github.com/TakeLab/spacy-udpipe),但它不能开箱即用。。。之后
nlp = spacy_udpipe.load("sk")
tr = pytextrank.TextRank()
nlp.add_pipe(tr.PipelineComponent, name="textrank", last=True)
doc = nlp(text)
我得到带有POS和DEP标记的令牌,但是doc._.phrases
中没有任何内容(doc.noun_chunks
也是空的),而nlp.pipe_names
中只有['textrank']
我应该向spacy的管道添加什么才能使其正常工作?我想pytextrank需要名词块
任何提示或建议都会对我有所帮助-谢谢
你介意在PyTextRank回购协议上开始讨论这个问题吗? https://github.com/DerwenAI/pytextrank/issues
此外,如果您能提供示例文本(使用要求的语言)
我们将尝试调试此集成
谢谢你指出
帕科
我找到了解决办法!我不确定
nlp.Defaults.syntax_iterators = {"noun_chunks" : get_chunks}
有多干净,但它是有效的(它基于syntax_iterators.py
和__init__.py
中的spaCy/lang/en
名词块是如何定义的)相关问题 更多 >
编程相关推荐