Pandas变频

2024-04-26 03:27:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我在尝试是否可以使用data.asfreq(MonthEnd())而不使用date_range创建的数据。 我要做什么。我使用以下代码运行csv查询:

import numpy as np
import pandas as pd
data = pd.read_csv("https://www.quandl.com/api/v3/datasets/FRED/GDPC1.csv?api_key=", parse_dates=True)
data.columns = ["period", "integ"]
data['period'] =  pd.to_datetime(data['period'], infer_datetime_format=True)

然后,我想通过以下操作将频率分配给“周期”列:

^{pr2}$

还有一些印刷品:

print(data)
print(data.period.freq)
print(data.dtypes)

退货:

..........
270 1948-07-01   2033.2
271 1948-04-01   2021.9
272 1948-01-01   1989.5
273 1947-10-01   1960.7
274 1947-07-01   1930.3
275 1947-04-01   1932.3
276 1947-01-01   1934.5

[277 rows x 2 columns]
-92 days +00:00:00
period    datetime64[ns]
integ            float64
dtype: object

我还可以通过将原始的'DATE'列设为'index'来解析它:

data = pd.read_csv("https://www.quandl.com/api/v3/datasets/FRED/GDPC1.csv?api_key=", parse_dates=True, index_col='DATE')

我想做的只是把季度数据转换成每月行。例如:

270 1948-07-01   2033.2
271 1948-06-01   NaN
272 1948-05-01   NaN
273 1948-04-01   2021.9
274 1948-03-01   NaN
275 1948-02-01   NaN
276 1948-01-01   1989.5
......and so on.......

我最终尝试使用ts.asfreq(MonthBegin())ts.asfreq(MonthBegin(), method='pad')来实现这一点。到目前为止还没有成功。我有以下错误:

NameError: name 'MonthBegin' is not defined

我的问题是,如果不使用date_range来创建框架,我可以使用asfreq吗?以某种方式将我的日期列“传递”给函数。如果这不是解决方案,有没有其他简单的方法将季度频率转换为每月频率?在


Tags: csv数据importapitruedatadaterange
1条回答
网友
1楼 · 发布于 2024-04-26 03:27:16

使用TimeGrouper

import pandas as pd

periods = ['1948-07-01', '1948-04-01', '1948-01-01', '1947-10-01',
           '1947-07-01', '1947-04-01', '1947-01-01']
integs = [2033.2, 2021.9, 1989.5, 1960.7, 1930.3, 1932.3, 1934.5]
df = pd.DataFrame({'period': pd.to_datetime(periods), 'integ': integs})
df = df.set_index('period')

df = df.groupby(pd.TimeGrouper('MS')).sum().sort_index(ascending=False)

编辑:也可以使用resample代替TimeGrouper

^{pr2}$

相关问题 更多 >