序列标记由平均感知器驱动。

sequence-tagging的Python项目详细描述


词性标注

使用平均感知器的词性标记器。

基于here

中的标记符

它使用以下功能:

  • 当前单词的后缀(最后3个字符)(未格式化)。
  • 当前单词的前缀(第一个字符)(未格式化)。
  • 当前单词。
  • 语音标记的前一部分和当前单词。
  • 语音标签的前一部分。
  • 前一个单词的词性标记。
  • 前两部分的语音标签。
  • 上一个词。
  • 上一个单词的后缀。
  • 两步后的单词。
  • 下一个词。
  • 下一个单词后缀。
  • 下一个单词后面的单词。
  • 偏倚

包括以下预训练模型。

  • POS标记器,接受过CONLL 2000分块数据培训
  • chunker,接受过conll 2000分块数据培训
  • 插槽填充器,接受ATIS数据培训

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Oracle将休眠为ISO 8601日期格式   当有线程时,swing计时器不会停止。睡在Java里面   如何使用swing在java中清空密码字段值(字符串)   如何在编辑文本字段上设置单词java(安卓)   单独类中的java OkHttp请求   java Tomcat配置文件/上下文xml似乎已经崩溃了。请确保它是可分析和有效的。有关详细信息,请参阅服务器日志   java在科尔多瓦的ActivityResult上传递   java如何在映射中保持插入顺序。工厂?   “DataOutputStream”和“ObjectOutputStream”之间的java差异   java从FTP文件列表中获取项目的时间戳   java如何在spring security中为每个人忽略一些资源/URL?   模板类嵌套时新的Java泛型类构造函数问题   java读取并查找文件大小为1GB的行   java如何使用字符串say“stop”停止整数格式的while循环   java是否可以在应用程序启动之间将JVM保留在内存中?   java Springboot出现“出现意外错误(类型=内部服务器错误,状态=500)”的问题