识别方法。文本中的洋葱链接?

2024-05-28 21:10:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我怎样才能识别。洋葱链接在一篇文章中,记住它们可以以各种方式出现

hfajlhfjkdsflkdsja.onion
http://hfajlhfjkdsflkdsja.onion
http://www.hfajlhfjkdsflkdsja.onion

我在考虑regex,但是(.*?.onion)将返回URL链接所在的整个段落


Tags: httpurl链接www方式文章regex段落
3条回答

没有正则表达式的方法:

url = 'http://hfajlhfjkdsflkdsja.onion'
split = url.split('.onion')
if len(split)==2 && len(split[1])==0:
   %do something

这样就可以了:(?:https?://)?(?:www)?(\S*?\.onion)\b(添加了非捕获组-credit:@WiktorStribiżew)

演示:

s = '''hfajlhfjkdsflkdsja.onion
https://hfajlhfjkdsflkdsja.onion
http://www.hfajlhfjkdsflkdsja.onion
https://www.google.com
https://stackoverflow.com'''


for m in re.finditer(r'(?:https?://)?(?:www)?(\S*?\.onion)\b', s, re.M | re.IGNORECASE):
    print(m.group(0))

输出

^{pr2}$

简单快捷:

([^\s]+\.onion)

匹配从第一个空格到“.洋葱”的所有字符。在

相关问题 更多 >

    热门问题