超级紧凑日本代币器
tinysegmenter3的Python项目详细描述
tinysegender
----
tinysegender——超级紧凑型日文标记器最初是由
(c)2008 Taku Kudo根据新的BSD许可条款为JavaScript创建的。
有关详细信息,请参见[此处](http://lilyx.net/pages/tinysegender\u license.txt)
python2.x的tinysegender是由Masato Hagiwara编写的。
有关信息,请参见[此处](http://lilyx.net/pages/tinysegmenterp.html)
@cocoatomo和@甲烷。
tokenized_statement=tinysegener.tokenize(statement)
print(tokenize_statement)
《《〈31169〉、‘12399'、‘python’、‘python’、‘站着的’、‘站着的’、‘工程师’、‘工程师’、'.]
```
[测试文本](http://www.genpaku.org/timemachine/timemachine/timemachineu8timemachineu8www.genpaku.genpaku.org/timemachine/timemachine/time(在“tests”目录中)是H.G.Wells的[时间机器](https://en.wikipedia.org/wiki/the_time_machine),由Hiroo Yamagata根据CC BY-SA 2.0许可证翻译成日语。
```
----
tinysegender——超级紧凑型日文标记器最初是由
(c)2008 Taku Kudo根据新的BSD许可条款为JavaScript创建的。
有关详细信息,请参见[此处](http://lilyx.net/pages/tinysegender\u license.txt)
python2.x的tinysegender是由Masato Hagiwara编写的。
有关信息,请参见[此处](http://lilyx.net/pages/tinysegmenterp.html)
@cocoatomo和@甲烷。
tokenized_statement=tinysegener.tokenize(statement)
print(tokenize_statement)
《《〈31169〉、‘12399'、‘python’、‘python’、‘站着的’、‘站着的’、‘工程师’、‘工程师’、'.]
```
[测试文本](http://www.genpaku.org/timemachine/timemachine/timemachineu8timemachineu8www.genpaku.genpaku.org/timemachine/timemachine/time(在“tests”目录中)是H.G.Wells的[时间机器](https://en.wikipedia.org/wiki/the_time_machine),由Hiroo Yamagata根据CC BY-SA 2.0许可证翻译成日语。
```