Beautifulsoup查找具有特定tex的HTML标记

1条回答

网友

1楼 · 发布于 2024-06-08 15:44:57

我也是个漂亮的新手。一定有更好的方法，但这个方法似乎有效：

from bs4 import BeautifulSoup
import re

def predicate(element):
    pattern = re.compile(r'Set Item')
    return element.name == u'h5' and element.find(text=pattern) 

if __name__ == '__main__':
    soup = BeautifulSoup(open('index.html').read())
    found = soup.find_all(predicate) # found: a list of elements
    print 'Found:', found

请原谅open（）.read（）链。我只是在偷懒。在

输出：

^{pr2}$

更新

谓词不需要使用正则表达式：

def predicate(e):
    return e and e.name == u'h5' and 'Set Item' in e.text

编程相关推荐

java为什么Scanner类不像println方法那样使用重载的概念
java Jersey：接受枚举请求参数的整数
java如何在EclipseKepler中安装Hibernate？
java在修补servlet中的jsp文件时获取NullPointerException
java“addScript”在HSQL中是否有最大记录计数？
java Maven使用@Ignore运行单元测试
java是args[0]，args[1]变量吗？
java Swing JScrollPane溢出
java与Facebook Graph Api更新机制的集成，无需实时更新
java矩形在多边形内？

更新

相关问题更多 >

编程相关推荐

热门问题

热门文章

Beautifulsoup查找具有特定tex的HTML标记

更新

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >