2024-04-23 21:39:15 发布
网友
假设以下数据集已对日期列表排序:
dates=pd.DataFrame(data={'client':['1','2'], 'date':[['2012-3-10','2012-3-11','2012-3-12','2012-3-13','2012-3-14'], ['2012-3-12','2012-3-13','2012-3-16','2012-3-23']]})
我想找出平均日期差 因此,例如,对于Client'2',Average Timelag将是{}
Client
'2'
Average Timelag
开始于:
client date 0 1 [2012-3-10, 2012-3-11, 2012-3-12, 2012-3-13, 2... 1 2 [2012-3-12, 2012-3-13, 2012-3-16, 2012-3-23]
你可以的
要获取days中的timedelta:
days
timedelta
client 1 [1.0, 1.0, 1.0, 1.0] 2 [1.0, 3.0, 7.0]
或者
dates.groupby('client')['date'].apply(lambda x: np.mean([i / np.timedelta64(1, 'D') for i in np.diff([pd.to_datetime(c) for c in x])[0]]))
对于mean:
mean
client 1 1.000000 2 3.666667
这是重复:
Difference between two dates?
看起来您可以使用datetime模块来解析导入到支持代数的对象中的日期和/或时间字符串。在
https://docs.python.org/2/library/datetime.html
干杯
开始于:
你可以的
^{pr2}$要获取
days
中的timedelta
:或者
对于
mean
:这是重复:
Difference between two dates?
看起来您可以使用datetime模块来解析导入到支持代数的对象中的日期和/或时间字符串。在
https://docs.python.org/2/library/datetime.html
干杯
相关问题 更多 >
编程相关推荐