获取文本中名词的性别?

2024-04-26 12:26:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个包含以下类别名称的文本:

  • 人们的名词:“玛丽”、“约翰”
  • 地点/对象名词:“帝国大厦”、“华沙”
  • 设备:“船舶”、“飞机”

这些名词在文中可以用不同的代词来指称:

  • “她”,“他”
  • “它”,“它”
  • “她”,“它”

有没有一种方法可以自动“知道”将用于“玛丽”或“约翰”的代词? 我怀疑这可能是基于每个可能名词的查找表,但我没有找到这样的数据

我对Python的解决方案感兴趣。NLTK可能有一个功能,但我没有找到它,但任何其他方式可能是一个伟大的事后诸葛亮

一个相关的问题是: Get gender from noun using NLTK with German corpora


Tags: 数据对象方法文本功能名称解决方案类别