将MeCab解析结果转换为Python对象。
youcab的Python项目详细描述
YouCab:将MeCab解析结果转换为Python对象
安装
Install MeCab
MeCab需要MeCab才能工作。 如果尚未安装,请先安装install MeCab。在
Install YouCab
$ pip install youcab
标记日语句子
在这个示例代码中,我们使用MeCab的默认字典生成一个标记器并运行标记化。 标记器将文本转换为Word对象的列表。在
^{pr2}$surface: 本pos : ['名詞', '一般']base : 本c_type : c_form : surface: をpos : ['助詞', '格助詞', '一般']base : をc_type : c_form : surface: 読んpos : ['動詞', '自立']base : 読むc_type : 五段・マ行c_form : 連用タ接続surface: だpos : ['助動詞']base : だc_type : 特殊・タc_form : 基本形
可用于任何MeCab词典
可以使用IPAdic、UniDic和neologd之类的词典。在
fromyoucabimportyoucabtokenize=youcab.generate_tokenizer(dicdir="/path/to/mecab/dic/dir/")
- 项目
标签: