java UIMA RUTA未在“<!”之后注释文本
我正在使用UIMA RUTA对广泛的文档进行注释。它们来自不同的来源,有时会出现字符组合<;!存在于文档的中间。<;之后的文本;!被注释为标记并被其他注释忽略
有没有办法改变这种行为? 即使我关闭了标记注释,在<;之后的文本也会被删除;!未被任何其他批注批注
我找到了负责创建大多数标记注释的代码部分(org.apache.uima.ruta.seed包中的DefaultSeeder),但我无法找到负责以<;开头的标记注释的代码部分
谢谢你的建议
# 1 楼答案
有几种选择。最可能的情况是,您希望将RutaEngine配置为使用不同的播种机,即TextSeeder而不是DefaultSeeder。TextSeeder不会创建标记批注
您还可以更改可见性设置,以便正常处理标记批注覆盖的文本,例如,使用ADDRETAINTYPE(标记)