我是NLP的乞丐。我正在为我的NLP项目使用spaCy python库。这是我的要求
我有一个包含所有国家名称的JSON文件。现在我需要解析并得到文件中每个国家的金牌数。鉴于 在例句下面
"Czech Republic won 5 gold medals at olympics. Slovakia won 0 medals olympics"
我能查到国家的名字,但不是奖牌数。下面是我的代码。请帮助继续。在
^{pr2}$另外,如果给定的文本是
"Czech Republic won 5 gold medals at olympics in 1995. Slovakia won 0 medals olympics"
Spacy提供了您可以使用的Rule-based matching。在
它们可以如下使用:
输出:
上面的代码应该可以让你开始。当然,您必须编写自己更复杂的规则,以便处理以下情况: “捷克共和国在1995年奥运会上获得了5枚金牌,这一点也不奇怪。” 以及其他更复杂的句子结构。在
相关问题 更多 >
编程相关推荐