Python中文
首页
教程
问答
标签
搜索
登录
注册
如何从网页垃圾中获取所有页面
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在尝试从这个网站的所有页面获取所有鞋子的列表<a href="https://www.dickssportinggoods.com/f/all-mens-footwear" rel="nofollow noreferrer">https://www.dickssportinggoods.com/f/all-mens-footwear</a>,但是我不知道在我的代码中还需要写什么。 基本上我想从网站的所有页面中选择一个品牌的鞋子。例如,我想选择新的Balance鞋,我想按我选择的branc名称打印所有鞋的列表。下面是我的代码</p> <pre><code>from bs4 import BeautifulSoup as soup from urllib.request import urlopen as uReq Url = 'https://www.dickssportinggoods.com/f/all-mens-footwear' uClient = uReq(Url) Page = uClient.read() uClient.close() page_soup = soup(Page, "html.parser") for i in page_soup.findAll("div", {"class":"rs-facet-name-container"}): print(i.text) </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>你可以点击过滤器按钮,检查所有你想要的品牌。 你只需要做<code>driver.find element by xpath()</code> 如果你使用硒,你必须知道这一点</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
无法从packag中的父目录导入模块
7 回答
无法从packag导入python模块
4 回答
无法从pag中提取所有数据
8 回答
无法从paho python mq中的线程发布
1 回答
无法从pandas datafram中删除列
3 回答
无法从Pandas read_csv正确读取数据
1 回答
无法从pandas_ml的“sklearn.preprocessing”导入名称“inputer”
3 回答
无法从pandas_m导入ConfusionMatrix
4 回答
无法从Pandas数据帧中选择行,从cs读取
9 回答
无法从pandas数据框中提取正确的列
6 回答
无法从Pandas的列名中删除unicode字符
2 回答
无法从pandas转到dask dataframe,memory
1 回答
无法从pandas转换。\u libs.tslibs.timestamps.Timestamp到datetime.datetime
5 回答
无法从Parrot AR Dron的cv2.VideoCapture获得视频
9 回答
无法从parse_args()中的子parser获取返回的命名空间
10 回答
无法从patsy导入数据矩阵
4 回答
无法从PayP接收ipn信号
2 回答
无法从PC删除virtualenv目录
8 回答
无法从PC访问Raspberry Pi中的简单瓶子网页
1 回答
无法从pdfplumb中的堆栈溢出恢复
1 回答