如何从带有奇怪DTD的URL请求HTML文件?

2024-04-20 08:23:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我想按日期从下面的URL中提取所有相关信息。 日期从2009年1月1日开始到现在。 信息包括日期、卢比/美元、35.4049、35.4929等内容

我希望所有这些类型的数据都按日期保存在熊猫数据框中

import pandas as pd
import arrow
import numpy as np
import matplotlib.pyplot as plt
import re
from bs4 import BeautifulSoup
from urllib.request import urlopen
import requests

url ="https://www.bom.mu/dealth-rate/downloadALL?field_dealing_date_value%5Bvalue%5D%5Bdate%5D=01-01-2009"


r = requests.get(url, allow_redirects=True) 
#open('google.ico', 'wb').write(r.content)

html_doc = r.content
html = BeautifulSoup(html_doc, 'lxml')

你能帮我吗


Tags: 数据fromimport信息url类型内容pandas