如果这是一个非常简单的问题,请原谅。我很久没写正则表达式了。非常感谢你们帮忙刷铁锈。我在python中使用regex
我试图通过一些网址解析。以下是我正在分析的URL的典型格式:
https://www.anysite.com/word/123456789/description-of-the-page
https://www.anysite.com/word/123456789/description-of-the-page/someword
https://www.anysite.com/word/123456789/description-of-the-page/thisword
https://www.anysite.com/word/123456789/description-of-the-page/anyword
我想写一个表达式,将只匹配第一个网址,而不是最后三个。也就是说,我想要一个正则表达式,只有在数字字符串“123456789”后面的“/”后面没有“/”时才匹配。你知道吗
忽略主URL,我尝试了否定的前瞻断言,但没有成功:
/word\/.+?\/(?!\/).+/
这与所有四个示例都匹配。你知道吗
我不能具体到不以“/someword”“/thisword”或“/anyword”结尾,因为我没有这些单词的完整列表。你知道吗
再次感谢您的关注和思考!你知道吗
怎么样:
您可以这样做:
^https?:\/\/[^\d]*(\d+)\/[^\/]*$
演示:http://regex101.com/r/aC8aJ7
相关问题 更多 >
编程相关推荐