超级紧凑日本代币器

tinysegmenter3的Python项目详细描述


tinysegender
----


tinysegender——超级紧凑型日文标记器最初是由
(c)2008 Taku Kudo根据新的BSD许可条款为JavaScript创建的。
有关详细信息,请参见[此处](http://lilyx.net/pages/tinysegender\u license.txt)

python2.x的tinysegender是由Masato Hagiwara编写的。
有关信息,请参见[此处](http://lilyx.net/pages/tinysegmenterp.html)


@cocoatomo和@甲烷。


tokenized_statement=tinysegener.tokenize(statement)
print(tokenize_statement)
《《〈31169〉、‘12399'、‘python’、‘python’、‘站着的’、‘站着的’、‘工程师’、‘工程师’、'.]
```










[测试文本](http://www.genpaku.org/timemachine/timemachine/timemachineu8timemachineu8www.genpaku.genpaku.org/timemachine/timemachine/time(在“tests”目录中)是H.G.Wells的[时间机器](https://en.wikipedia.org/wiki/the_time_machine),由Hiroo Yamagata根据CC BY-SA 2.0许可证翻译成日语。

```

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java以编程方式从TableLayout中删除所有行   Java Web Sart Ubuntu12.1。加载资源(图像)   人们如何让Java SPNEGO客户端在Windows中工作?   java Eclipselink:ObjectArrayMapping和ClassDescriptor   控制台中带有引号/空格的java Javafx命名参数   java创建服务失败:找不到对象?   java Hazelcast:如何在测试期间禁用自动发现?   使用TuckyUrlRewriteFilter rermoteaddr的java块IP   javascript如何在angular 4中进行同步http调用   输入字符串的java排列   java Jenkins不是以Xrs Xmx2048m XX:MaxPermSize=512m(windows)开始的   AWS EMR上的java avro错误   java从两个ArrayList中提取特定连接的对象,组合这些相关对象并从子类中打印   java从主题中删除什么时间点消息?   谷歌像素设备上的java InvalidKeyException   java如何在执行测试后重建项目   java Android 2.2 readUTF()socket问题   按下安卓设备上的“后退”按钮后java Toast没有完成?