我有一根这样的绳子:
<iframe src="https://www.facebook.com/plugins/post.php?href=https%3A%2F%2Fwww.facebook.com%2FDoctorTaniya%2Fposts%2F1906676949620646&width=500" width="500" height="482" style="border:none;overflow:hidden" scrolling="no" frameborder="0" allowTransparency="true"></iframe>
我想提取链接:
^{pr2}$如何编写一个python脚本来实现这一点?在
输出
^{pr2}$Here是一些有关Regex的有用信息,可以在Python中查找url。在
如果您编写的所有url都将在
.php?href=
之后开始工作,那么您可以创建一个循环,在找到?href=
时停止并拆分字符串。在或者您可以使用
$_GET[]
并将其打印出来,here是您可能想阅读的另一篇文章。在我想用beautiful soup代替会更好。在
要分析的文本是带有
src
的iframe
标记。您正在尝试在src
属性中检索href=
之后和&width
之前的url。在之后,您需要将url解码回文本。在
首先,你把它扔进漂亮的汤里,然后把它的属性去掉:
然后你可以在这里使用regex或者使用
^{pr2}$.split()
(相当老套):最后,您需要使用^{} 对url进行解码:
你完了!在
因此产生的代码是:
相关问题 更多 >
编程相关推荐