使用BeautifulSoup按标签内容搜索
我想通过标签里的文字内容来搜索特定的标签。例如:
<a href="http://goinghere.com">Lets go somewhere</a>
我想通过搜索文本“Lets go somewhere”来找到上面的内容。现在我用的是正则表达式(re)。请问用BeautifulSoup能做到吗?还是在这种情况下用正则表达式更好?
1 个回答
2
s = BeautifulSoup(...)
s.find(text='Lets go somewhere')
你也可以使用正则表达式。
使用BeautifulSoup查找包含特定文本的HTML标签
编辑:虽然在命令行上使用find方法时会打印出一个字符串,但那其实只是它返回的对象的表示;你可以通过访问它的parent属性来获取它的BeautifulSoup标签对象。