为什么使用适当的协议捕获URL会失败？

2条回答

网友

1楼 · 编辑于 2024-05-16 04:05:28

您的模式\/(?=\s)要求URL以斜杠结尾。您可以通过在测试代码段中任何URL的末尾添加斜杠来检查这一点

没有真正的理由这样做-您可以删除\/，并允许URL以任何后跟空格的字符结尾

但是，除此之外，您还应该注意空格的功能不是很强大。如果URL出现在文本中，则后面可能会有标点或括号，标点或括号在技术上是有效的URL字符，您的筛选器（减去\/）将包括这些字符，即使它们可能不是URL的一部分

在这些情况下，显然存在一些歧义，但在URL末尾排除任何标点符号可能是更好的启发

（如果你想变得真的老练，你可以像GitHub的markdown解析器那样，在的末尾加上右括号，只要它们与URL中的左括号匹配。这有助于识别像(See https://en.wikipedia.org/wiki/Something_(disambiguation))这样的上下文中的链接。但仅使用正则表达式是不可行的，需要一些额外的处理。）

网友
2楼 · 编辑于 2024-05-16 04:05:28

相关问题更多 >

编程相关推荐

热门问题

热门文章

为什么使用适当的协议捕获URL会失败？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >