自然语言处理的api。
texterra的Python项目详细描述
这个包为texterra api提供了一个python接口。 texterra是一个用于自然语言处理和知识库利用的工具包, 由伊万尼科夫系统编程研究所的一个研究小组开发。
有关texterra项目的详细信息,请参见https://texterra.ispras.ru。
功能
- 语言检测
- 标记化
- 元素化
- 句子边界检测
- 词性标注
- 命名实体识别
- 标记依赖项分析
- 术语消歧
- 关键概念提取
- 主观性检测
- 情绪分析
- 拼写更正
目前,支持两种语言:英语和俄语。
安装
要安装此sdk,请运行:
python setup.py install
也可以使用pip安装:
pip install texterra
文档
您可以使用pydoc获得有关包的帮助:
pydoc texterra
并检查方法文档:
pydoc texterra.api
用法
要在项目中使用texterra api,首先需要获取api密钥here。 然后,import包并使用api密钥创建访问对象:
importtexterrat=texterra.API('YOURKEY')
要访问不同的工具,只需调用相应的方法:
tags=t.pos_tagging('Hello World')
方法也接受iterables:
tagged_sents=t.pos_tagging(['Flat is better than nested.','Now is better than never.'])