有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

java UIMA RUTA未在“<!”之后注释文本

我正在使用UIMA RUTA对广泛的文档进行注释。它们来自不同的来源,有时会出现字符组合<;!存在于文档的中间。<;之后的文本;!被注释为标记并被其他注释忽略

有没有办法改变这种行为? 即使我关闭了标记注释,在<;之后的文本也会被删除;!未被任何其他批注批注

我找到了负责创建大多数标记注释的代码部分(org.apache.uima.ruta.seed包中的DefaultSeeder),但我无法找到负责以<;开头的标记注释的代码部分

谢谢你的建议


共 (1) 个答案

  1. # 1 楼答案

    有几种选择。最可能的情况是,您希望将RutaEngine配置为使用不同的播种机,即TextSeeder而不是DefaultSeeder。TextSeeder不会创建标记批注

    您还可以更改可见性设置,以便正常处理标记批注覆盖的文本,例如,使用ADDRETAINTYPE(标记)