处理公司名称的python库
cleanco的Python项目详细描述
#cleanco-清除组织名称
##它是干什么的?
这是一个处理公司名称的python包,提供了 去掉表示组织类型的术语(如“有限公司”或“公司”)的名称。
使用组织类型术语的数据库,它还提供了一个实用程序来推断 组织类型,根据美国/英国商业实体类型(即“有限责任 “公司”或“非盈利”)。
最后,该系统使用“信息”一词来表示该组织可以 建立在。例如,公司名称中的“oy”表示 在芬兰,而公司名称中的“有限公司”可以指英国、美国或其他一些国家 国家。
##如何安装? 从这个站点下载并解压缩目录。
- mac:cd并在其中输入sudo python setup.py install和系统密码。
- windows:同样的东西,但是没有sudo。
##它是如何工作的? 让我们看看一些示例代码。首先,创建模块的实例:
>>> from cleanco import cleanco
准备要处理的公司名称字符串:
>>> business_name = "Some Big Pharma, LLC"
放入实例:
>>> x = cleanco(business_name)
现在您可以获取公司类型:
>>> x.type() ['Limited Liability Company']
…可能的国家…
>>> x.country() ['United States of America', 'Philippines']
…以及公司名称的清晰版本。
>>> x.clean_name() 'Some Big Pharma'
##有虫子吗? 你最好相信。请告诉我,否则就放弃这个项目。我确信有些公司的后缀是错误的,我遗漏了很多信息。
##特别感谢:
- 维基百科的[商业实体类型文章](http://en.wikipedia.org/wiki/Types_of_business_entity),我在那里花了几个小时的研究。
- 贡献者:Petri Savolainen<;petri.savolainen@koodaamo.fi>;