在循环中使用请求提供的HTML与在循环外使用不同

for d in date_generated: date = str(d).replace("00:00:00", "") url = "https://www.x-rates.com/historical/?from=USD&amount=1&date=" + date page = requests.get(url, timeout=5) soup = BeautifulSoup(page.content, "html.parser") table = soup.find("tbody") for i,x in zip(table.find_all("a"), table.find_all("td", class_="")): time.sleep(3) request += 1 elapsed_time = time.time() - start_time print(i.text.strip(), x.text.strip())

start_time = time.time() start = datetime.datetime.strptime("2018-07-07", "%Y-%m-%d") end = datetime.datetime.strptime("2018-07-12", "%Y-%m-%d") date_generated = [start + datetime.timedelta(days=p) for p in range(0, (end- start).days)]

3条回答

网友

1楼 · 编辑于 2024-04-26 23:06:30

为了这个答案，让我们假设d的值等于2018-07-07 00:00:00。你知道吗

尽管如此，当你跑步时：

date = str(d).replace("00:00:00", "")

您忘记了2018-07-07和00:00:00之间的空格。你知道吗

所以您应该将这行替换为：

date = str(d).replace(" 00:00:00", "")

希望这能解决你的问题：）

网友

2楼 · 编辑于 2024-04-26 23:06:30

网站将限制请求的数量。为了解决这个问题，您需要指定请求头。试试这个：

for d in date_generated:
    date = str(d).replace("00:00:00", "")
    url = "https://www.x-rates.com/historical/?from=USD&amount=1&date=" + date
    head = {'user-agent': ('Mozilla/5.0 (X11; Linux x86_64)'
                              'AppleWebKit/537.36 (KHTML, like Gecko)'
                              'Chrome/66.0.3359.139 Safari/537.36'),
                              'referer': None}
    head['referer'] = url

    page = requests.get(url, timeout=5, headers=head)

网友

3楼 · 编辑于 2024-04-26 23:06:30

您可能会使网站过载，一次发送的请求太多，并且超时。按照@hootnot的建议，尝试在循环中放置一个time.sleep(1)。如果（1）不够，请尝试更长的超时时间。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章