bnltk(bangla natural language processing toolkit)是一个用于孟加拉自然语言处理的开源python包。

bnltk的Python项目详细描述


bnltk

Build StatusLicense: MIT

bnltk(bangla natural language processing toolkit)是一个用于孟加拉自然语言处理的开源python包。它包括标记化、词干分析、词性标注等模块。我期待着帮助贡献者们把这件事做得更好

安装

pip安装bnltk

用法

标记器

from bnltk.tokenize import Tokenizers
t = Tokenizers()
print(t.bn_word_tokenizer(' আমার সোনার বাংলা । '))		

茎干器

from bnltk.stemmer import BanglaStemmer
bn_stemmer = BanglaStemmer()
print(bn_stemmer.stem('খেয়েছিলো'))

部分标签

要使用tagger的各个部分,您需要下载一些数据文件,如下所示:

from bnltk.bnltk_downloads import DataFiles
DataFiles().download()	

成功下载文件后,您可以使用此模块。

pos_tagger = PosTagger()    
pos_tagger.loader()
sentences = 'দুশ্চিন্তার কোন কারণই নাই'
print(pos_tagger.tagger(sentences))  

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java从Struts操作的钩子更改表单值(Liferay 6.2)   java如何改变Spring MVC处理url“点”字符的行为   Clojure中使用Java接口的问题   junit如何模拟comosDB azure java集成客户端?   运行函数时发生java错误   netbeans Java。jar文件和依赖项   Eclipse中文本字段中的java输入类型   在JAVA中,将集合变量从实时批处理运行时传递到调用批处理文件   java通过Bean验证API中的自定义消息管理异常   XML到json的转换,在Java中,同时保留数据类型   根据JAVA中的列名从Excel文件中获取单元格值   在AsyncTask的doInBackground中未调用java FirebaseMessagingService   java如何在数据库中插入一行?