序列标记由平均感知器驱动。
sequence-tagging的Python项目详细描述
词性标注
使用平均感知器的词性标记器。
基于here
中的标记符它使用以下功能:
- 当前单词的后缀(最后3个字符)(未格式化)。
- 当前单词的前缀(第一个字符)(未格式化)。
- 当前单词。
- 语音标记的前一部分和当前单词。
- 语音标签的前一部分。
- 前一个单词的词性标记。
- 前两部分的语音标签。
- 上一个词。
- 上一个单词的后缀。
- 两步后的单词。
- 下一个词。
- 下一个单词后缀。
- 下一个单词后面的单词。
- 偏倚
包括以下预训练模型。
- POS标记器,接受过CONLL 2000分块数据培训
- chunker,接受过conll 2000分块数据培训
- 插槽填充器,接受ATIS数据培训