text = 'https://www.nytimes.com/2017/10/09/us/politics/corkers-blast-at-trump-has-other-republicans-nodding-in-agreement.html?rref=collection%2Fsectioncollection%2Fpolitics\r\n'
test = re.findall(r"^http* com$",text)
结果:
test = [ ]
我期望的输出如下所示:
www.nytimes.com
Tags:
这将匹配http或https以及任何类型的域(.gov.us、.com.de、.edu…)
^http=从http开始
"^http.*
=将匹配http或https\:\/\/
=escape://(.*?)
=匹配组a.k.a您想要的内容(没有?
将匹配到最后一个/
)\/
=第一次出现“/”你的正则表达式模式是错误的。模式中不应该有任何空格,用
.*
替换*
,并避免最后用$
锚定正则表达式。试试这个您也可以尝试以下方法:
输出:
相关问题 更多 >
编程相关推荐