正则表达式匹配除“/”以外的所有内容

2024-06-13 03:38:13 发布

您现在位置:Python中文网/ 问答频道 /正文

如果这是一个非常简单的问题,请原谅。我很久没写正则表达式了。非常感谢你们帮忙刷铁锈。我在python中使用regex

我试图通过一些网址解析。以下是我正在分析的URL的典型格式:

https://www.anysite.com/word/123456789/description-of-the-page
https://www.anysite.com/word/123456789/description-of-the-page/someword
https://www.anysite.com/word/123456789/description-of-the-page/thisword
https://www.anysite.com/word/123456789/description-of-the-page/anyword

我想写一个表达式,将只匹配第一个网址,而不是最后三个。也就是说,我想要一个正则表达式,只有在数字字符串“123456789”后面的“/”后面没有“/”时才匹配。你知道吗

忽略主URL,我尝试了否定的前瞻断言,但没有成功:

/word\/.+?\/(?!\/).+/

这与所有四个示例都匹配。你知道吗

我不能具体到不以“/someword”“/thisword”或“/anyword”结尾,因为我没有这些单词的完整列表。你知道吗

再次感谢您的关注和思考!你知道吗


Tags: ofthehttpscomurlwwwpagedescription