一周一只Pandas

2024-05-15 13:00:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我想一个月一个星期,几个月可能有四个星期,有些可能有五个星期。 每次约会我都想知道它属于哪个星期。我对这个月的最后一周最感兴趣。

data = pd.DataFrame(pd.date_range(' 1/ 1/ 2000', periods = 100, freq ='D'))

0  2000-01-01
1  2000-01-02
2  2000-01-03
3  2000-01-04
4  2000-01-05
5  2000-01-06
6  2000-01-07

Tags: dataframedatadaterange感兴趣pd约会freq
3条回答

看看这个answer并决定你想要哪个星期。

没有内置的,所以您需要使用apply计算它。例如,对于一个简单的“有多少个7天的周期已经过去”的度量。

data['wom'] = data[0].apply(lambda d: (d.day-1) // 7 + 1)

对于更复杂的(基于日历),使用该答案中的函数。

import datetime
import calendar

def week_of_month(tgtdate):
    tgtdate = tgtdate.to_datetime()

    days_this_month = calendar.mdays[tgtdate.month]
    for i in range(1, days_this_month):
        d = datetime.datetime(tgtdate.year, tgtdate.month, i)
        if d.day - d.weekday() > 0:
            startdate = d
            break
    # now we canuse the modulo 7 appraoch
    return (tgtdate - startdate).days //7 + 1

data['calendar_wom'] = data[0].apply(week_of_month)

我在处理具有日期时间索引的数据帧时使用了下面的代码。

import pandas as pd
import math

def add_week_of_month(df):
    df['week_in_month'] = pd.to_numeric(df.index.day/7)
    df['week_in_month'] = df['week_in_month'].apply(lambda x: math.ceil(x))
    return df

如果运行此示例:

df = test = pd.DataFrame({'count':['a','b','c','d','e']},
                     index = ['2018-01-01', '2018-01-08','2018-01-31','2018-02-01','2018-02-28'])
df.index = pd.to_datetime(df.index)

您应该得到以下数据帧

               count  week_in_month

2018-01-01     a              1
2018-01-08     b              2
2018-01-31     c              5
2018-02-01     d              1
2018-02-28     e              4

这似乎对我有好处

df_dates = pd.DataFrame({'date':pd.bdate_range(df['date'].min(),df['date'].max())})
df_dates_tues = df_dates[df_dates['date'].dt.weekday==2].copy()
df_dates_tues['week']=np.mod(df_dates_tues['date'].dt.strftime('%W').astype(int),4)

相关问题 更多 >