将Pandas数据帧转换为Tensorflow数据

1条回答

网友

1楼 · 发布于 2024-05-15 14:33:13

正如@VGR所提到的，Matcher的实例将只搜索最初给定的字符串。如果要搜索新字符串，则必须创建Matcher的新实例。在您的情况下，下一次搜索将从上次匹配后的索引开始。例如：

Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(text);
int start = 0;
while (matcher.find(start)) {
    text = text + text.substring(matcher.start(), matcher.end());
    start = matcher.end();
    matcher = pattern.matcher(text);
}

如果您还没有意识到，那么您应该知道text = text + subString创建了一个全新的String对象，然后将其分配给原始的text变量。这意味着，尽管text引用了“更新的”文本，matcher只知道在创建matcher时String引用的text对象。这就是为什么对于您的用例，您必须为每个循环创建一个新的Matcher实例

可选地，您可以考虑使用{A1}，以避免每次迭代创建一个全新的字符串（Matter）的开销。不过，您仍然需要跟踪start索引，因为每次迭代都需要重置Matcher对象，以便它识别StringBuilder对象的更新/更长的内部结束索引（即附加文本）。例如：

StringBuilder stringBuilder = new StringBuilder(text);
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(stringBuilder);
int start = 0;
while (matcher.find(start)) {
    stringBuilder.append(stringBuilder, matcher.start(), matcher.end());
    start = matcher.end();
    matcher.reset();
}
text = stringBuilder.toString();

最后，一定要小心。除非您在正则表达式中有一些非常时髦的魔力（这完全是另一个问题），否则如果在文本中找到至少一个模式实例，那么这段代码将永远循环。我建议您在while循环上添加一个附加条件或某种计数器

相关问题更多 >

编程相关推荐

热门问题

热门文章