文本流核心文本挖掘模块
tf-core的Python项目详细描述
#textflows核心模块
一个[textflows](https://github.com/xflows/textflows/)包,其中包含用于表示带注释的文档语料库的核心类,以及基于[nltk](http://www.nltk.org/)的文本挖掘小部件(ui组件)。包还可以与[clowdflows](https://github.com/xflows/clowdflows/)3一起使用。
[![文档状态](https://readthedocs.org/projects/rdm/badge/?version=latest)](http://docs.textflows.org/)
目前,该项目包含几个用于文本预处理的组件:标记化、停止字删除、引理化、词性标注等。
##安装,文档
请在[阅读文档](http://docs.textflows.org/)上找到安装说明、示例和api参考。
##注
请注意,这是一个研究项目,可以(也可以)定期进行重大的改变。更改记录在[ChangeLog]中(changelog.md)。
欢迎提出请求和问题。
##tf_core软件包代码的贡献者
马蒂克·佩罗韦克(@mperice)、马蒂吉·马丁奇(@matej martinc)、罗曼·奥拉奇(@romanorac)
- 卢布尔雅那Jo_ef Stefan研究所[知识工程技术部](http://kt.ijs.si)