如何对已经标记的文件使用StanfordNLP工具（POSTagger和Parser）？

config = { 'processors': 'pos,lemma,depparse', 'lang': 'de', 'pos_model_path': './de_gsd_models/de_gsd_tagger.pt', 'pos_pretrain_path': './de_gsd_models/de_gsd.pretrain.pt', 'lemma_model_path': './de_gsd_models/de_gsd_lemmatizer.pt', 'depparse_model_path': './de_gsd_models/de_gsd_parser.pt', 'depparse_pretrain_path': './de_gsd_models/de_gsd.pretrain.pt}'

1条回答

网友

1楼 · 发布于 2024-05-26 21:53:02

您需要包括tokenize处理器，并将属性tokenize_pretokenized设置为True。这将假定文本在空格和换行符分隔的句子上标记。您还可以通过一个字符串列表，每个列表代表一个句子，条目是标记

这里解释如下：

https://stanfordnlp.github.io/stanza/tokenize.html

编程相关推荐

spring JSTL：绝对uri：http://java.sun.com/jsp/jstl/core无法在两个站点中解析。xml或与此应用程序一起部署的jar文件
java在Junit测试中找不到失败的符号
java为什么在没有同步块的情况下调用wait（）、notify（）或notifyAll（）不是编译器错误？
使用onDraw（）绘制多个位图的java Android在曲面视图上放大缩小画布
在java中比较args值和字符串
java更改文件中的特定字节
java TransformerFactory破坏<html>标记中的<input>和<br>标记
azure appinsights java自定义指标不起作用
Java泛型在实现接口的类上指定上界，接口本身指定上界
java AS400 prog和动态类路径

相关问题更多 >

编程相关推荐

热门问题

热门文章