Udmurt文本的部分语言标记实用程序

udmurttagger的Python项目详细描述


本模块包含一个Udmurt文本词性标记的实用程序。 该工具基于LSTM神经网络,考虑了词序。在

安装

该工具可与pip一起安装

pip3 install udmurttagger

注意:必须单独下载实用程序的模型。 由于项目规模的限制,我无法放置它 在github或PiPy上。启动程序后,它将下载 打开模型的包装。你不需要采取行动。但你呢 需要150兆的互联网连接 交通。在

使用示例

一次标注一个句子

^{pr2}$

标签集

基于UDMURT CORPORA的标记集

  • 形容词
  • 形容词代词
  • 副词
  • 副词代词
  • CNJ-连词
  • IMIT-视频电话
  • INTRJ-感叹词
  • 名词
  • NUM-数字
  • 插入词
  • 部分-粒子
  • PN-专有名词(名词的子类型)
  • 后置
  • PREDIC-谓语
  • 前代词
  • 动词

有关详细信息,请参见page。在

型号

此工具可用于消除基于规则的标记的歧义。在

你可以自己包装训练过的模型。在

模型评估:损失:0.2281-acc:0.9845-val U损失:0.2643-val U acc:0.9782。在

联系人

您可以通过电子邮件联系项目的设计者:

Boris Orekhov(nevmenandr)

@gmail

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在Java中使用BufferedReader类读取文本文件的子字符串   java如何在JSP页面上包含来自另一台服务器的动态JSP   使用单表策略的java持久化Hibernate继承映射   java报告状态失败达600秒。谋杀!报告hadoop的进展   java将字符串解析为形状   使用JTable的java ClassCastException?   java在Spring引导中关闭数据库   java Android Studio调试错误(Ubuntu)   java如何区分apache beam中KV实例中的两个键?   java将RealmObjectChangeListener添加到异步下载的RealmObject   java匹配模式之前的所有内容,包括新行和/或回车   java使用JAXB在XML中动态更改元素序列   java如何在MACOS中找到动态库(.dylib文件)的版本   Android中的java Nanohttpd服务器   java libGDX:3d动画不工作