使用BeautifulSoup抓取URL - 问答 - Python中文网

使用BeautifulSoup抓取URL

2024-05-16 07:00:52 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我正在抓取一个板球时间表的网站。我在用美味的汤。这是网址

www.ecb.c0.uk/stats/fixtures-results?m=1&y=2016

指2016年1月的所有固定装置。
我也在努力争取其他年份和月份。有没有一种方法可以让我在代码中更改年份，作为刮花的一部分？我需要在URL中放置一个变量吗？我需要形成一个循环还是通过一个列表循环？你知道吗

 from bs4 import BeautifulSoup
 import requests

 html = requests.get("http://www.ecb.co.uk/stats/fixtures-results?m=1& y=2016").text
 soup = BeautifulSoup(html,'lxml')

Tags： import 网站 html www stats 时间表 requests fixtures

1条回答

网友

1楼 · 发布于 2024-05-16 07:00:52

可以使用两个循环，第一个循环数年，第二个循环数月：

base_url = "http://www.ecb.co.uk/stats/fixtures-results?m={month}&y={year}"

for year in range(2000, 2017):
    for month in range(1, 13):
        requests.get(base_url.format(month=month, year=year))

一个或多个带有itertools的较短变体：

for year, month in itertools.product(range(2000, 2017), range(1, 13)):
    requests.get(base_url.format(month=month, year=year))

相关问题更多 >

编程相关推荐

热门问题

热门文章