python中的XML SDMX读取

2024-06-01 05:42:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在努力从以下链接使用python读取SDMX XML文件: https://www.newyorkfed.org/xml/fedfunds.htmldirect

理想情况下,我希望将基金利率纳入数据框架,但我尝试使用pandasdmx,它似乎与此不兼容

我当前的代码: f

rom urllib.request import urlopen
import xml.etree.ElementTree as ET

url = "https://websvcgatewayx2.frbny.org/autorates_fedfunds_external/services/v1_0/fedfunds/xml/retrieve?typ=RATE&f=03012016&t=04032020"

d2 = urlopen(url).read()
root  ET.fromstring(d2)

for elem in root.iter():
    k = elem.get('OBS_VALUE')
    if k is not None:
        print(k)

我想得到这样的东西:

             FUNDRATE_OBS_POINT='1%' FUNDRATE_OBS_POINT='25%'
2020-04-02   0.03                    0.05
2020-04-01   0.03                    0.05
2020-04-01   0.01                    0.05

我发现这个方法非常难看,对于每个“数据”,我需要检查它是否没有。有没有更好的办法


Tags: 数据httpsorgimporturlrootxmlet
1条回答
网友
1楼 · 发布于 2024-06-01 05:42:42

试着做以下几点:

from lxml import etree
import requests

resp = requests.get(url)

doc = etree.fromstring(resp.content)

headers = []
dates = []
columns = []

fop = doc.xpath('//Series[@FUNDRATE_OBS_POINT]')
datpath = fop[0].xpath('//*[@*="ns13:ObsType"]')
for dat in datpath:
    dates.append(dat.attrib.get('TIME_PERIOD'))
for item in fop:
    headers.append(item.attrib.get('FUNDRATE_OBS_POINT'))
    entries = item.xpath('//*[@*="ns13:ObsType"]')
    column = []
    for entry in entries:
        column.append(entry.attrib.get('OBS_VALUE'))
    columns.append(column)


df = pd.DataFrame(columns=headers,index=dates)

for a, b in zip(headers,columns):
    df[a] = b
df.head(3)

输出:

             1%     25%     50%     75%     99%  TARGET_HIGH  TARGET_LOW
2020-04-02  0.03    0.03    0.03    0.03    0.03    0.03    0.03
2020-04-01  0.03    0.03    0.03    0.03    0.03    0.03    0.03
2020-03-31  0.01    0.01    0.01    0.01    0.01    0.01    0.01

相关问题 更多 >