将MeCab解析结果转换为Python对象。

youcab的Python项目详细描述


YouCab:将MeCab解析结果转换为Python对象

PyPI VersionPython VersionsLicenseCode style: blackImports: isort

安装

Install MeCab

MeCab需要MeCab才能工作。 如果尚未安装,请先安装install MeCab。在

Install YouCab

$ pip install youcab

标记日语句子

在这个示例代码中,我们使用MeCab的默认字典生成一个标记器并运行标记化。 标记器将文本转换为Word对象的列表。在

^{pr2}$
surface: 本pos    : ['名詞', '一般']base   : 本c_type : c_form : surface: をpos    : ['助詞', '格助詞', '一般']base   : をc_type : c_form : surface: 読んpos    : ['動詞', '自立']base   : 読むc_type : 五段・マ行c_form : 連用タ接続surface: だpos    : ['助動詞']base   : だc_type : 特殊・タc_form : 基本形

可用于任何MeCab词典

可以使用IPAdic、UniDicneologd之类的词典。在

fromyoucabimportyoucabtokenize=youcab.generate_tokenizer(dicdir="/path/to/mecab/dic/dir/")

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
具有未知数量条件的java If语句   java如何在Spark中使用两个“条件”进行过滤?   雅加达ee为ColdFusion提供的最佳Java ee服务器   java如何在jersey的MessageBodyWriter方法中获取writeTo中的anotations值?   java从脚本文件调用jar文件中的函数   java在执行insert语句后,如何获得id值为的语句?   在OS X上设置OpenCV Java绑定   java使用for循环遍历数组x。以字符串形式返回x的元素,其中每个元素由一个空格分隔   ApacheiClientBuilder为Algolia Java创建的APIClient是线程安全的吗?   java在DFS/BFS算法中获取邻居时避免内存分配?   java使用AES/CBC/PKCS5P加密大文件(2GB)   允许保存/加载列布局的Java DB网格组件   队列大小为1的java Spring调度   跑步带有Java参数的exe   java正则表达式将所有“<”和“>”标记替换为“&lt;”及“&gt;”在<<![CDATA]>标签?   java何时同步变量?