日语mecab形态分析器的python包装

mecab-python3的Python项目详细描述


这是用于MeCab形态分析器的python包装器 日语文本。它适用于Python3.4及更高版本,以及 Python2.7。

基本用法

>>>importMeCab>>>wakati=MeCab.Tagger("-Owakati")>>>wakati.parse("pythonが大好きです").split()['python','が','大好き','です']>>>chasen=MeCab.Tagger("-Ochasen")>>>print(chasen.parse("pythonが大好きです"))pythonpythonpython名詞-固有名詞-組織助詞-格助詞-一般大好きダイスキ大好き名詞-形容動詞語幹ですデスです助動詞特殊・デス基本形EOS

mecab-python3的api紧跟mecab本身的api, 即使这使它不是很“Python”。请咨询麦加 文档以获取更多信息。

安装

二进制控制盘可用于MacOSX和Linux,并已安装 默认情况下,当您使用pip

pip install mecab-python3

这些轮子包括一个mecab的内部(静态链接的)副本 库和^{}字典的副本(使用 utf-8文本编码),默认情况下自动使用。如果你 如果希望使用其他字典,则需要安装它 你自己,写一个mecabrc文件,指导mecab使用它,并设置 指向此文件的环境变量MECABRC

要使用pip从源代码构建,

pip install --no-binary :all: mecab-python3

或者,可以使用pip下载源代码,然后构建它 手工:

pip download --no-binary :all: mecab-python3
tar zxf mecab-python3-{version}.tar.gz
cd mecab-python3-{version}
python3 setup.py build
# install as you like

当从源代码构建模块时,它要求系统 提供Mecab图书馆和至少一本字典。你一定有 SWIG,mecab库和头文件,以及安装的字典 在运行pip installsetup.py build之前。例如,在 基于debian的linux,

sudo apt-get install swig libmecab-dev mecab-ipadic-utf8

使用捆绑的库和字典构建轮子 在经过清理的CI环境中受支持。参考中的脚本 scripts源树的子目录,以查看它是如何完成的。

许可

就像mecab本身一样,mecab-python3是由 Taku Kudotaku@chasen.org和日本电报电话公司, 并在3子句bsd许可下分发(参见文件BSD)。 或者,它可以根据 GNU通用公共许可证,版本2(参见文件GPL)或 GNU Lesser通用公共许可,2.1版(请参阅文件LGPL)。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java抽象基bean类   Java中的字符串比较“=”有什么问题?   java Android VideoView无法播放视频   java Lucene 5.3 Highlighter getBestFragments()不工作   java将PDF直接从数据库打开到用户的PDF应用程序中   波形Java库用于确定wav文件中的语音注释   java gzip压缩器不支持while循环   java JUnit输出不包括小黄瓜前缀   java日志记录的复杂性和对MessageFormat性能的关注   spring是否有一种方法可以在每次使用Java控制器方法时调用该方法?   帮助器类上的java重写方法   java绘制曲线箭头,将箭头置于正确位置   内存mymap=new int[500000][500000]需要多大的Eclipse Java堆空间;没有OutOfMemoryError?   java Drools从具有不同事实的多个DRL文件中触发多个规则