假设我有以下HTML:
<p>
If everybody minded their own business, the world would go around a great deal faster than it does.
</p>
<p>
Who in the world am I? Ah, that's the great puzzle.
</p>
我想能够找到所有的标签,包含所有的关键字,我正在寻找。E、 g.(例2和例3不起作用):
^{pr2}$我一直在试图想出一个正则表达式,允许我搜索所有关键字,但似乎ANDing是不可能的(只有ORing)。在
提前谢谢!在
进行这种复杂匹配的最简单方法是write a function that performs the match,并将函数作为
text
参数的值传入。在现在可以得到匹配的字符串:
^{pr2}$要获取包含字符串的标记,请使用.parent运算符:
您可能需要考虑使用lxml而不是BeautifulSoup。 lxml允许您通过xpath查找元素:
使用此锅炉板设置:
这将查找包含字符串
^{pr2}$world
的所有<p>
标记中的文本:这将查找包含}的所有
world
和{<p>
标记中的所有文本:但最有效的方法可能是:
相关问题 更多 >
编程相关推荐