我正在刮这个URL
我想把所有的餐馆都搜索一下,这样我就可以在单独的变量中得到餐馆的名称、菜系类型和营业时间,但我不知道如何迭代它们
您可以从链接中看到餐厅RESTAURANT DU CASINO IVORY
和LA STUB DU CASINO
在同一个div div.infos-restos
中,所以我要迭代h3
,然后让下一个兄弟姐妹进入Type of cuisine
这是我的密码
for rests in dining_soup.select("div.infos-restos"):
for rest in rests.select("h3"):
print(" Rest Name: "+rest.text)
print(rest.next_sibling.next_sibling.next_sibling.next_sibling.string)
另一个问题:):第print(rest.next_sibling.next_sibling.next_sibling.next_sibling.string)
行打印完整的HTML。如何只获取文本?你知道吗
我建议你用^{}
beautifulsoup不支持
xpath
在我看来,用
xpath
从DOM中提取数据要简单得多以下是您的操作方法:
输出:
附言: 这个网站的html写得不好,没有合适的结构。这就是为什么
xpath
又长又丑的原因相关问题 更多 >
编程相关推荐