igo日本形态分析仪的python端口
igo-python的Python项目详细描述
关于
Igo是用java和common lisp编写的日语形态分析器。 本软件是igo的python端口(java版本)。
注意
未提供词典生成器。您需要使用igo java版本来为igo构建字典。 从igo python 0.9.7开始,为了便于使用,就包含了预构建的IPA dictionary (2.7.0-20070801)。
如何使用
您可以轻松使用igo python:
>>> from igo.Tagger import Tagger >>> t = Tagger() # use bundled dictionary >>> for m in t.parse(u'すもももももももものうち'): ... print m.surface, m.feature ... すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ >>>
使用命令行分析器:
$ igo # or python -m igo.parse 私の名前は中野です 私 名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ の 助詞,連体化,*,*,*,*,の,ノ,ノ 名前 名詞,一般,*,*,*,*,名前,ナマエ,ナマエ は 助詞,係助詞,*,*,*,*,は,ハ,ワ 中野 名詞,固有名詞,地域,一般,*,*,中野,ナカノ,ナカノ です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス EOS
igo python的变更日志
- 2018-09-22–1.0.0
- 从支持的python版本中删除了python 3.3。
- 2017-02-09–0.9.9
- 修复了一些小问题并添加了单元测试。
- 2016-07-08–0.9.8
- 修复了代理项对字符处理问题
- 2015年12月16日–0.9.7.1
- 标签可以在python2 env上腌制
- 2015年12月14日–0.9.7
- 包括预建的IPA字典
- 2015-07-03–0.9.6
- 修复了mmap模式下字典大小的问题
- 2015年4月14日–0.9.5
- 如果可能,请使用mmap加载词典的文件
- 2013-07-05–0.9.3
- 支持补充平面中的字符
- 2012年2月27日–0.9.2
- 在igo(java)0.4.4中应用更改
- 2012年2月27日–0.9.1
- 与igo(java)0.4.5同步
- 2011-09-01–0.9
- 与python3.2兼容
- 将代码库更新为igo-0.4.3
- 添加一些增强和清理。
- 2011-08-29–0.4
- 添加一些增强和清理。
- 2010年11月28日–0.3A
- 修复错误(如果短语以“_”结尾将导致错误)
- 2010年11月27日–0.3
- 删除与mmap相关的代码
- 减少内存占用
- 2010年11月27日–0.2
- 支持谷歌应用引擎(可能)
- 2010年11月27日–0.1a
- 仅更新包信息。
- 2010年11月25日–0.1
- 第一次释放。