Python网页抓取html与xpath语法issu

2条回答

网友

1楼 · 编辑于 2024-04-26 03:17:24

使用xpath有必要吗？我很容易就得到了bs4所有艺术家的名单

import requests
from bs4 import BeautifulSoup

response = requests.get('https://www.billboard.com/charts/hot-100')
soup = BeautifulSoup(response.content, 'lxml')
artists = [row.text.strip() for row in soup.select('.chart-row__artist')]
print(artists)

网友

2楼 · 编辑于 2024-04-26 03:17:24

我想XPath的语法是对的。似乎歌曲与艺术家匹配得很好，尽管艺术家的元素节点是交替的。我做到了：

artists = [x.strip() for x in tree.xpath('//*[@class="chart-row__artist"]/text()')]

前缀//*选择了整个文档，然后与类名匹配，因此它同时包含了“a”元素和“span”元素

编程相关推荐

如何将数据从浏览器拖放到具有自定义MIME类型的java swing应用程序中？
java JMockit：如何模拟受保护的方法？
java为什么待办事项已满时服务器socket连接未被拒绝？
java我应该如何并行化计算代价高昂的for循环并整理迭代结果？
java如何以不同的方式编写这部分代码？
java代码没有看到JTextField的值，尽管它显示在接口中
java我对Spring boot中的bean有问题
java在客户端使用CometD获取传输和EOF异常
如何在Java libGDX中正确地为游戏添加示意图
java捕获异常类型两次

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python网页抓取html与xpath语法issu

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >