我将下表包含在以下数据框中:
cost cost cost val1 val1 val1
user_id 1 2 3 1 2 3
timestamp
01/01/2011 1 100 3 5
01/02/2013 20 8
01/07/2012 19 57
01/11/2014 3100 49
21/12/2012 240 30
14/09/2013 21 63
01/12/2013 3200 51
我想知道如何获得另一个数据帧,该数据帧仅包含所有用户id的所有相同字段的总和(例如,用户1、2和3的“成本”字段的总和),但日期按升序重新排序。你知道吗
用于获取上表的代码为:
import pandas as pd
newnames = ['timestamp','user_id', 'cost', 'val1','val2', 'val3','code']
df = pd.read_csv('mytest.csv', names = newnames, header = False, parse_dates=True, dayfirst=True)
df['timestamp'] = pd.to_datetime(df['timestamp'], dayfirst=True)
pivoted = df.pivot('timestamp', 'user_id')
df.groupby('user_id')[['cost', 'val1','val2', 'val3']].sum()
事先谢谢你的帮助。你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐