这个python模块为treetagger提供了一个包装器。

jk_treetaggerwrapper的Python项目详细描述


jk廑u treetagger wrapper
===
==


简介
----


>这个python模块为treetagger提供了一个包装器。目前这个模块使用的是'treetaggerwrapper'模块,但这种依赖关系在未来会有所改变。

>关于这个模块的信息可以在这里找到:

*[github.org](https://github.com/jkpubsrc/python module jk treetaggerwrapper)
*[pypi.python.org](https://pypi.python.org/pypi/jk嫒treetaggerwrapper)

使用此模块来标记文本,首先需要实例化标记池。然后可以调用“tagtext2()”,以便在后台临时分配“treetagger”实例并执行pos标记。


注意:不鼓励调用“tagtext()”,因为它已被更好的实现替换。但出于兼容性的原因,它仍然可用。


可以指定四个参数:

*langid:包含要标记的文本的语言的id的字符串。
*text:要标记的文本。
*bWithconfidence:一个布尔值,指示是将结果与置信值一起返回,还是不带。
*bWithNullsInsteadOfUnknown:一个布尔值,指示是否将“未知”转换为空值。

每个元组具有以下结构:

*标记本身。
*指定的标记。
*引理。
*置信值。

>由标记引理组成的组可以多次返回。例如:

*令牌本身。
*分配的标记1。
*引理1。
*置信值1。
*分配的标记2(作为替代)。
*引理2(作为替代)。
*置信值2(作为替代)。


` treetaggerwrapper`遵循基于线程的并发模型。在标记“treetaggerwrapper”时,实例化在“treetaggerwrapper”对象的持续时间内处于活动状态的treetagger后台进程。然后,这个“treetaggerwrapper”对象与这个后台进程通信,并为此目的使用线程。因此,“jk_treetaggerwrapper”提供的“poolofreadedtretaggers”类绑定到此限制。

这不仅使您能够自由地使用此代码,而且还允许您进行贡献。请随时联系下面列出的本软件的作者,或
以获取评论、协作请求、改进建议或报告错误:

*jürgen knauth:jknauth@uni-goettingen.de,pubsrc@binary overflow.de


许可证
----


>此软件在以下许可证下提供:

*apache软件许可证2.0





欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
HTTP标头的java InputStream未终止   java测试SpringWebListener   具有定义的替换编号Java的regex ReplaceAll   在java中使用contains()方法   java在选择查询中使用JoinColumn字段   具有用户的java Start-stop demon不是以给定用户启动   java glBufferData生成GL\u无效\u操作   java中循环代码的循环   Java位无符号移位(>>>>)会产生奇怪的结果   java HQL使用点分隔符从select获取结果   条纹、弹簧、玩耍(或?):使用哪种高性能Java框架?   广播接收机中的java停止服务   java回收器视图占据整个屏幕。不在上面显示我的UI元素   java使MySQL查询更快   java MappedByteBuffer查询   java递归算法问题