Udmurt文本的部分语言标记实用程序

udmurttagger的Python项目详细描述


本模块包含一个Udmurt文本词性标记的实用程序。 该工具基于LSTM神经网络,考虑了词序。在

安装

该工具可与pip一起安装

pip3 install udmurttagger

注意:必须单独下载实用程序的模型。 由于项目规模的限制,我无法放置它 在github或PiPy上。启动程序后,它将下载 打开模型的包装。你不需要采取行动。但你呢 需要150兆的互联网连接 交通。在

使用示例

一次标注一个句子

^{pr2}$

标签集

基于UDMURT CORPORA的标记集

  • 形容词
  • 形容词代词
  • 副词
  • 副词代词
  • CNJ-连词
  • IMIT-视频电话
  • INTRJ-感叹词
  • 名词
  • NUM-数字
  • 插入词
  • 部分-粒子
  • PN-专有名词(名词的子类型)
  • 后置
  • PREDIC-谓语
  • 前代词
  • 动词

有关详细信息,请参见page。在

型号

此工具可用于消除基于规则的标记的歧义。在

你可以自己包装训练过的模型。在

模型评估:损失:0.2281-acc:0.9845-val U损失:0.2643-val U acc:0.9782。在

联系人

您可以通过电子邮件联系项目的设计者:

Boris Orekhov(nevmenandr)

@gmail

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在ElasticSearch中将SearchHit转换为Java对象   第三方库类的java重写XmlAdapter   java如何使用动画类获得平滑的动画效果?   Java PDFBox如果文本内容超过PDF的第一页,如何添加新页面?   Java二叉搜索树u根到最近叶的距离   java什么是diff Scanner和BufferedReader   java如何设计不生成并行数组的程序   java多次声明变量会降低执行速度吗?   java如何使用JXLAPI读取下拉列表的值   多线程为什么自定义阻塞队列在Java中不是线程安全的   java在一个变量中每输入1000个单位,就从另一个变量中减去1?   java Mapstruct通用映射器   Java中的类能否确定它是否已被修改?   java如何在MogoOperations聚合函数中定义输出类型?