在Python中使用正则表达式时只返回一个字符串

1条回答

网友

1楼 · 发布于 2024-05-16 09:10:21

如果您只希望每个输入字符串有一个匹配项，请不要使用findall，因为它的主要目的是查找多个匹配项。你知道吗

相反，使用re.match(pattern, text)获取match对象。检查返回值是否不是None（表示没有找到匹配项），然后对其调用group(1)以获取匹配的组。你知道吗

请注意，您的模式实际上并没有按您所说的做。如果只想匹配URL的初始部分（包括域，但不包括路径），则需要从模式的重复部分排除斜杠。我会用'(http://[^/]+)/'。使用+?而不是+的非贪婪重复是另一种选择。你知道吗

如果您考虑放弃整个RegEx方法来处理您的URL，那么您可能需要尝试使用urllib模块。调用urllib.parse.urlsplit将把URL分成以下几个部分：<scheme>://<netloc>/<path>?<query>#<fragment>。（这可能是python3中的一个新函数，尽管我不确定这一点。urllib模块在版本之间重新排列了不少。）

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Python中使用正则表达式时只返回一个字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >