文本分析API

bookworm的Python项目详细描述


这是一个Bookworm自然语言API的Python客户机,由Crawlica提供。

您可以在https://bookworm.crawlica.com/request_api_key/注册以接收api密钥

示例用法

importtabulatefrombookwormimportBookwormAPI_KEY='...'documents=['De två största städerna i Sverige är Stockholm och Göteborg','Donald Trump blir Barack Obamas efterträdare']b=Bookworm(API_KEY,'sv')res=b.entities(documents)forentsinres:data=[[ent['entity'],ent['type'],', '.join(ent['variants'])]forentinents]print(tabulate.tabulate(data,headers=['Entity','Type','Variants']))print('')
Entity     Type    Variants
---------  ------  ----------
Sverige    geo     Sverige
Stockholm  geo     Stockholm
Göteborg   geo     Göteborg

Entity        Type    Variants
------------  ------  -------------
Donald Trump  person  Donald Trump
Barack Obama  person  Barack Obamas

安装

$ pip install bookworm

当前可用的功能

  • autotag-使用我们大型标记数据库中的最佳匹配标记自动标记文档。
  • wordsmash-比较文档集以获得使子集特殊的本质。得到定义词和短语。
  • entities-从每个文档中提取命名实体(人员、组织和位置)
  • emotion-获取每个文档的正负值的数字表示形式
  • wordcount-获取文档中不同单词的计数。偏斜分为基本形式,停止字可以删除。
  • cluster-根据主题自动将文档收集到组中,并描述这些组。
  • categorize-自动将文档放入您选择的一组类别中。类别是由主题词定义的,但是文档不需要包含这些词中的任何一个,只需要包含“close”词。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
javascript节点js require()和Rhino Shell load()之间的区别是什么?   While循环中的java If语句   java GXT如何在XTemplate中显示treeobject?   如何将黑白图像加载到二进制文件中?   java ORMLite不知道如何存储班级航班。扫描仪。modelFX。机场航空公司的AirlineFx。使用另一个类或自定义持久器   java组织。阿帕奇。德比。客户是SqlException JSP和JSTL查询   spring如何将clob数据分配给java变量   java从上的表获取数据(Spring)   javaphp使用Exec执行带有用户定义参数的Jar文件   java jsonschema2pojo:引用相同类型的对象   使用原语从Scala调用Java vararg方法   java ClassNotFoundException:ClientBuilder Jersey 2.25.1 Tomcat 9.0   Android(Java)cr_BindingManager:无法调用determinedVisibility()从未看到pid的连接:   Java使用LocalTime类比较没有日期的时间   Java如何初始化对象的参数?