我有一个文本文件名weburl,其中有许多url,我只想使用regex获取基本url 网址
wikimapia.org/1649944/Bahawalpur-Railway-Station
panoramio.com/photo/84118355
wikimapia.org/1649944/Bahawalpur-Railway-Station
nativepakistan.com/photos-of-bahawalpur
defence.pk/threads/pictures-of-pakistan-railways.303027
nativepakistan.com/photos-of-bahawalpur
panoramio.com/photo/51311162
https://hiveminer.com/User/Pakistan Rail Buff
需要这个吗
wikimapia.org
panoramio.com
wikimapia.org
nativepakistan.com
defence.pk
nativepakistan.com
panoramio.com
https://hiveminer.com
如何使用regex?你知道吗
一种解决方案是:
它匹配行的开头(
^
),后跟可选协议规范,例如https://
((?:\w+://)?
)。然后它匹配任意数量的任何(.*?
)直到一个可选的端口规范,比如:80
((?::\d+)?
)。最后,它检查匹配后是否有一个/
或行的结尾$
(psitive look ahead(?=/|$)
)。你知道吗Check it out here at regex101。你知道吗
请注意,如果不想匹配端口部分,可以将其移到正面展望中。即
^(?:\w+://)?.*?(?=(?::\d+)?(?:/|$))
相关问题 更多 >
编程相关推荐