日语mecab形态分析器的python包装
mecab-python3的Python项目详细描述
这是用于MeCab形态分析器的python包装器 日语文本。它适用于Python3.4及更高版本,以及 Python2.7。
基本用法
>>>importMeCab>>>wakati=MeCab.Tagger("-Owakati")>>>wakati.parse("pythonが大好きです").split()['python','が','大好き','です']>>>chasen=MeCab.Tagger("-Ochasen")>>>print(chasen.parse("pythonが大好きです"))pythonpythonpython名詞-固有名詞-組織がガが助詞-格助詞-一般大好きダイスキ大好き名詞-形容動詞語幹ですデスです助動詞特殊・デス基本形EOS
mecab-python3
的api紧跟mecab本身的api,
即使这使它不是很“Python”。请咨询麦加
文档以获取更多信息。
安装
二进制控制盘可用于MacOSX和Linux,并已安装
默认情况下,当您使用pip
:
pip install mecab-python3
这些轮子包括一个mecab的内部(静态链接的)副本
库和^{mecabrc
文件,指导mecab使用它,并设置
指向此文件的环境变量MECABRC
。
要使用pip从源代码构建,
pip install --no-binary :all: mecab-python3
或者,可以使用pip下载源代码,然后构建它 手工:
pip download --no-binary :all: mecab-python3 tar zxf mecab-python3-{version}.tar.gz cd mecab-python3-{version} python3 setup.py build # install as you like
当从源代码构建模块时,它要求系统
提供Mecab图书馆和至少一本字典。你一定有
SWIG,mecab库和头文件,以及安装的字典
在运行pip install
或setup.py build
之前。例如,在
基于debian的linux,
sudo apt-get install swig libmecab-dev mecab-ipadic-utf8
使用捆绑的库和字典构建轮子
在经过清理的CI环境中受支持。参考中的脚本
scripts
源树的子目录,以查看它是如何完成的。
许可
就像mecab本身一样,mecab-python3
是由
Taku Kudotaku@chasen.org和日本电报电话公司,
并在3子句bsd许可下分发(参见文件BSD
)。
或者,它可以根据
GNU通用公共许可证,版本2(参见文件GPL
)或
GNU Lesser通用公共许可,2.1版(请参阅文件LGPL
)。