日本形态分析引擎。

Janome的Python项目详细描述


https://travis-ci.org/mocobeta/janome.svg?branch=masterhttps://ci.appveyor.com/api/projects/status/47d4avyw07voo331/branch/master?svg=truehttps://coveralls.io/repos/github/mocobeta/janome/badge.svg?branch=masterhttps://badges.gitter.im/org.pnghttps://img.shields.io/pypi/dm/Janome.svg

janome是一个用纯python编写的日语形态分析引擎。

一般文档:

https://mocobeta.github.io/janome/en/(英语)

https://mocobeta.github.io/janome/(日语)

要求

python 2.7.x或3.3+是必需的。

安装

[注意]这将消耗大约500 MB的内存用于构建。

(venv) $ python setup.py install

运行

(env) $ python
>>> from janome.tokenizer import Tokenizer
>>> t= Tokenizer()
>>> for token in t.tokenize(u'すもももももももものうち'):
...     print(token)
...
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も    助詞,係助詞,*,*,*,*,も,モ,モ
もも  名詞,一般,*,*,*,*,もも,モモ,モモ
も    助詞,係助詞,*,*,*,*,も,モ,モ
もも  名詞,一般,*,*,*,*,もも,モモ,モモ
の    助詞,連体化,*,*,*,*,の,ノ,ノ
うち  名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
(env) $ python
>>> from janome.tokenizer import Tokenizer
>>> from janome.analyzer import Analyzer
>>> from janome.charfilter import *
>>> from janome.tokenfilter import *
>>> text= u'蛇の目はPure Pythonな形態素解析器です。'
>>> char_filters=[UnicodeNormalizeCharFilter(), RegexReplaceCharFilter(u'蛇の目', u'janome')]
>>> tokenizer= Tokenizer()
>>> token_filters=[CompoundNounFilter(), POSStopFilter(['記号','助詞']), LowerCaseFilter()]
>>> a= Analyzer(char_filters, tokenizer, token_filters)
>>> for token in a.analyze(text):
...     print(token)
...
janome  名詞,固有名詞,組織,*,*,*,*,*,*
pure    名詞,固有名詞,組織,*,*,*,*,*,*
python  名詞,一般,*,*,*,*,*,*,*
な       助動詞,*,*,*,特殊・ダ,体言接続,だ,ナ,ナ
形態素解析器  名詞,複合,*,*,*,*,形態素解析器,ケイタイソカイセキキ,ケイタイソカイセキキ
です     助動詞,*,*,*,特殊・デス,基本形,です,デス,デス

对于贡献者

请查看此wiki页面:

https://github.com/mocobeta/janome/wiki#for-contributors

许可证

根据ApacheLicense2.0授权,并使用Mecab iPadic字典/统计模型。

有关许可证的详细信息,请参见license.txt和notice.txt。

确认

特别感谢@ikawaha,@takuyaa,@nakagami和@janome嫒oekaki。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Hibernate:合并并删除,而不是从数据库中删除实体对象   java如何在WebFilter中有条件地从Mono返回?   java调用mysql c3p0函数   可执行jar Java jar文件加载错误:无法找到或加载主类。类导致的错误:java。lang.ClassNotFoundException:某些东西。班   java如何减少/更改爬网后的延迟?   从其他语言(如Java、PHP、Perl、Python等)调用C/C++代码的最佳方式是什么?   java如何模拟影响对象的void返回方法   当我试图在ubuntu上启动JavaScala时,它抛出了一个异常   java如何正确输出游戏   理解java和C++背景下的JavaScript原型   oracle如何将Java函数转换为postgresql函数   多线程为什么我的java服务器程序在超时后不退出?   java如何使listView中的按钮在单击时工作?   试图将这个嵌套的java forloop转换为python,但我不知道如何转换。有没有一种方法可以像这样为循环执行if语句?   java幂函数在计算器中的应用   如何在java中滚动浏览mysql数据库   在Spring Boot应用程序的JUnit测试中,java没有符合自动连线JPA存储库要求的bean   java如何使用扩展类的JPanel对象?