日语mecab形态分析器的python包装

mecab-python3的Python项目详细描述


这是用于MeCab形态分析器的python包装器 日语文本。它适用于Python3.4及更高版本,以及 Python2.7。

基本用法

>>>importMeCab>>>wakati=MeCab.Tagger("-Owakati")>>>wakati.parse("pythonが大好きです").split()['python','が','大好き','です']>>>chasen=MeCab.Tagger("-Ochasen")>>>print(chasen.parse("pythonが大好きです"))pythonpythonpython名詞-固有名詞-組織助詞-格助詞-一般大好きダイスキ大好き名詞-形容動詞語幹ですデスです助動詞特殊・デス基本形EOS

mecab-python3的api紧跟mecab本身的api, 即使这使它不是很“Python”。请咨询麦加 文档以获取更多信息。

安装

二进制控制盘可用于MacOSX和Linux,并已安装 默认情况下,当您使用pip

pip install mecab-python3

这些轮子包括一个mecab的内部(静态链接的)副本 库和^{}字典的副本(使用 utf-8文本编码),默认情况下自动使用。如果你 如果希望使用其他字典,则需要安装它 你自己,写一个mecabrc文件,指导mecab使用它,并设置 指向此文件的环境变量MECABRC

要使用pip从源代码构建,

pip install --no-binary :all: mecab-python3

或者,可以使用pip下载源代码,然后构建它 手工:

pip download --no-binary :all: mecab-python3
tar zxf mecab-python3-{version}.tar.gz
cd mecab-python3-{version}
python3 setup.py build
# install as you like

当从源代码构建模块时,它要求系统 提供Mecab图书馆和至少一本字典。你一定有 SWIG,mecab库和头文件,以及安装的字典 在运行pip installsetup.py build之前。例如,在 基于debian的linux,

sudo apt-get install swig libmecab-dev mecab-ipadic-utf8

使用捆绑的库和字典构建轮子 在经过清理的CI环境中受支持。参考中的脚本 scripts源树的子目录,以查看它是如何完成的。

许可

就像mecab本身一样,mecab-python3是由 Taku Kudotaku@chasen.org和日本电报电话公司, 并在3子句bsd许可下分发(参见文件BSD)。 或者,它可以根据 GNU通用公共许可证,版本2(参见文件GPL)或 GNU Lesser通用公共许可,2.1版(请参阅文件LGPL)。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java Double。将长位加倍到C#位转换器。ToDouble   java如何使用正则表达式从固定的Y位数中提取最后的X位数?   java如何显示ChatMessage类列表中的字符串消息属性?   java从JSON或XML提要导入数据,并在Android中创建列表   在整数之间使用按位AND运算符的java好处?   java从Android中的Bean类获取空值?   java会话id对另一台服务器意味着什么?   java未选择案例时开关的工作方式   java组织。openqa。硒。SessionNotCreatedException:无法创建新的远程会话。在emulator中初始化安卓驱动程序时   JavaSWT父和子对话框通信   java请确保java_HOME指向JDK而不是JRE   java用户即使在成功登录后也是匿名的   java控制器单元测试无法自动连接所需的bean   Java小程序类文件