包装在crfsuite上的多用途顺序标记器

crfst的Python项目详细描述


crfsuitetager是基于[crfsuite]python包装(http://www.chokkan.org/software/crfsuite/“crfsuite”)的序列标记器。它是为分块、ner和其他基于bio(也称为iob)的文本注释任务而构建的。



u crfsuitetager具有多种常见功能,能够轻松集成其他功能。使用简单的基于字符串的特征模板控制这些特征。通过“crfsuitetager”构造函数上传递的新“功能生成函数”(请参见“crfsuitetager.ftex”),可以轻松添加其他功能。

需要以下python包和我的其他库之一:

*[pycrfsuite](https://github.com/tpeng/python-crfsuite“pycrfsuite”)—crfsuite的python包装器
*[numpy](http://www.numpy.org/“numpy”)—应该
*[bieval](https://github.com/savkov/bieval“bieval”)—我的用于评估bio样式注释的库,取代[conll-2000(http://ilk.uvt.nl/team/sabine/sabine/chunklink/chunklink/chunklink-2-2000-u for_conll.pl)的perl脚本的是[conll-2000(http://ilk.uvt.nll/team/sabine/sabine/chunklink/chunklink/chunklink-2-2000-bu

*命令行界面
*将数据结构迁移到[pan熊猫(http://pandapandas.pydata.org/“panda熊猫”大熊猫)的数据结构
*更多示例





;另请参见




如果你对其他序列感兴趣标签,你可能想看看:


*[斯坦福NLP](http://nlp.stanford.stanford.edu/software/lex-parser.shtml)pos tagger
*[方舟](http://www.ark.cs.cmu.edu/tweetnlp/)--pos tagger for tweets
*[山茶](http://chasen.org/~taku/software/yamcha/)--bio tagger/chunker
*[crf++(http://taku910.github.github.io/crfppp/)--bio tagger/chunker
>>*[斯坦福NLP](http://http://http://http://nlp.stan是的*[wapiti](https://wapiti.limsi.fr/)——pos&bio标签/chunker

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在代码中的确切位置将数据从firebase拉入安卓 studio?   java JPA Criteria API如何从JPA中获取单向多工单关系的反面   Java小程序:增加堆栈大小   JAVA网ConnectException:连接被拒绝:使用Spring boot连接Solr   java每日插入firebase数据库   Java中静态块的多线程线程安全   java如何获得具有两个泛型的参数化类型的类实例   java通过ssl将springboot应用程序与mysql服务器连接   在Android设备上运行时java React本机应用程序崩溃   基于类大小创建对象的java内存分配量   java ImageView与俄罗斯网址   java dowhile循环不会结束并使程序崩溃   在java中传递多个值   java Android Studio在i7处理器上使用100%CPU进行项目重建   java休眠在删除设备时添加一个新的休眠