在列中选择日期子集

2024-04-20 14:18:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个熊猫数据框日期时间.time关于索引和datetime.date日期在柱子上。例如

df =

          2006-02-01  2006-02-02     ...      2006-05-29  2009-06-01
08:00:00     1.45685     1.43830     ...         1.41020     1.42045
08:00:01     1.45685     1.43825     ...         1.41030     1.42040
08:00:02     1.45685     1.43810     ...         1.41025     1.42050
08:00:03     1.45685     1.43825     ...         1.41025     1.42060
...

我只想选择2006年的专栏。我如何做到这一点最简单和最快?你知道吗

我发现df.T['2006'].T起作用,但它包含两个转置。这不能直接在柱子上做吗?你知道吗


Tags: 数据dfdatetimedatetime时间专栏柱子
2条回答

如果您的列datetime.date日期对象,请尝试:

df.loc[:, '2006-01-01':'2006-12-31']

请尝试以下代码:

def getSubsetColumnsByYear(dataframe, year):
    df = dataframe
    try:
        startAt = df.columns.get_loc(year + '-01-01')
        endAt = df.columns.get_loc(year + '-12-31')

        return df[df.columns[startAt:endAt+1]]
    except KeyError:
        print('Not a valid year')


def testMethod():
    import pandas as pd
    data = { '2016-01-01':[1,1,1], '2016-01-02':[2,2,2], '2016-01-03':[3,3,3], '2016-01-04':[4,4,4], '2016-12-31':[31,31,31], '2017-01-01':[2,2,2],}
    df = pd.DataFrame(data=data)

    newdf = getSubsetColumnsByYear(df, '2016')
    print(newdf)

testMethod()

相关问题 更多 >