BeautifulSoup.select（）方法是否支持使用regex？

1条回答

网友

1楼 · 发布于 2024-05-14 19:28:00

soup.select()函数只支持CSS语法；正则表达式不属于该语法的一部分。

您可以使用这样的语法将结束于文本的属性匹配起来：

soup.select('#abc a[href$="xyz"]')

请参阅MSDN上的CSS attribute selectors documentation。

您始终可以使用CSS选择器的结果继续搜索：

for element in soup.select('#abc'):
    child_elements = element.find_all(href=re.compile('^http://example.com/\d+.html'))

注意，作为^{} documentation states：

This is a convenience for users who know the CSS selector syntax. You can do all this stuff with the Beautiful Soup API. And if CSS selectors are all you need, you might as well use lxml directly: it’s a lot faster, and it supports more CSS selectors. But this lets you combine simple CSS selectors with the Beautiful Soup API.

强调我的。

编程相关推荐

java Spring freemarker多模板加载程序路径
在java插件中从控制台获取输入
java在包中创建继承类
网页抓取Java Jsoup网页抓取
java在线程内创建一个对象，而true条件具有相同的引用
java如何根据空格数拆分字符串
java新的安卓 studio更新中的配置文件“app”是什么？
java在将ArrayList写入/读取到文件时出现奇怪的问题
java Reg替换文本块第一次出现+最后一次出现
java当我单击任何RecyclerView列表项时，如何在MainActivity的EditText中显示特定的单击项？

相关问题更多 >

编程相关推荐

热门问题

热门文章

BeautifulSoup.select（）方法是否支持使用regex？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >