如何使用robobrows刮取“ariaalabel”

from robobrowser import RoboBrowser browser = RoboBrowser(history=True, parser='html.parser') browser.open('https://www.scrapingwebsite.com') links = browser.find_all(class_='searchResult__373c0__1yggB') for link in links: print(link.find(class_='big_braket_class').text) problem_part = link.find(class_='subsidiary_class') print(problem_part.get('aria-label'))

1条回答

网友

1楼 · 发布于 2024-04-26 05:29:46

您可以将robobrowser中的内容转储到bs4中。然后在bs4 4.7.1中使用：has和：contains来定位所需的项。在

from bs4 import BeautifulSoup
#...your code
soup = browser.parsed
data = [(item.select_one('[class*=businessName]').text.replace('\xa0',''), item.select_one('[class*="i-stars"]')['aria-label']) for item in soup.select('li:has(h3:contains("All Results")) ~ li:has([class*=businessName])')]
print(data)

结果样本：

编程相关推荐

如何在不使用java安装outlook的情况下以编程方式创建pst文件？
如何在java中比较泛型方法中的数组？
JavaFXHTML节点元素
java H2数据库要降低的连接设置无效（2019）
安卓 hilt中的java依赖循环
java这个结构什么时候有意义？
带有模式和匹配器的Java正则表达式
来自类变量的java JNI jstring？
尝试从socket读取时发生java非法阻止模式异常
绑定中使用Moxy的java接口映射。xml不能使用多个接口？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用robobrows刮取“ariaalabel”

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >