名称分析器和格式化程序(用于政治家、个人和组织)
name-cleaver的Python项目详细描述
这是datacommons项目的名称解析器和标准化器。 它现在支持政治家、个人和组织的名字。
安装
安装很简单:
pip install name-cleaver
用法
对于每种类型的名称,基本用法都是相同的,只需从以下之一导入相关的namecleaver类:
- politiciannamecaver
- 个人姓名切割器
- 组织名称切割器
示例:
from name_cleaver import PoliticianNameCleaver smith = PoliticianNameCleaver(‘Smith, Robert J’).parse()
smith.first => “Robert” smith.middle => “J.” smith.last => “Smith”
print str(smith) => “Robert J. Smith”
如上所述的用法通常会返回一个name对象,但如果namecleaver被赋予了意外的输入,或者无法确定如何处理名称,则不能保证不会引发异常。您可以查找并处理name cleaver的unparseablenameexception类。如果不想处理异常,namecleaver有一个安全模式:
smith = PoliticianNameCleaver(‘Smith, Robert J’).parse(safe=True)
在安全模式下,如果namecleaver遇到异常或没有找到完整格式的名称,它将返回原始输入字符串。