文本分析API
bookworm的Python项目详细描述
这是一个Bookworm自然语言API的Python客户机,由Crawlica提供。
您可以在https://bookworm.crawlica.com/request_api_key/注册以接收api密钥
示例用法
importtabulatefrombookwormimportBookwormAPI_KEY='...'documents=['De två största städerna i Sverige är Stockholm och Göteborg','Donald Trump blir Barack Obamas efterträdare']b=Bookworm(API_KEY,'sv')res=b.entities(documents)forentsinres:data=[[ent['entity'],ent['type'],', '.join(ent['variants'])]forentinents]print(tabulate.tabulate(data,headers=['Entity','Type','Variants']))print('')
Entity Type Variants --------- ------ ---------- Sverige geo Sverige Stockholm geo Stockholm Göteborg geo Göteborg Entity Type Variants ------------ ------ ------------- Donald Trump person Donald Trump Barack Obama person Barack Obamas
安装
$ pip install bookworm
当前可用的功能
- autotag-使用我们大型标记数据库中的最佳匹配标记自动标记文档。
- wordsmash-比较文档集以获得使子集特殊的本质。得到定义词和短语。
- entities-从每个文档中提取命名实体(人员、组织和位置)
- emotion-获取每个文档的正负值的数字表示形式
- wordcount-获取文档中不同单词的计数。偏斜分为基本形式,停止字可以删除。
- cluster-根据主题自动将文档收集到组中,并描述这些组。
- categorize-自动将文档放入您选择的一组类别中。类别是由主题词定义的,但是文档不需要包含这些词中的任何一个,只需要包含“close”词。