我有一个记录清单,我需要计算每个参考和组每月的总和。
输入
Date1;Date2;Company;Reference;Description;Value;Currency;
24.01.2014;23.01.2014;Company1;Debit;Text;-100,00;EUR;
24.01.2014;24.01.2014;Company2;Debit;Text;-130,00;EUR;
21.01.2014;24.01.2014;Company1;Debit;Text;-50,00;EUR;
21.01.2014;21.01.2014;Company3;Credit;Text;600,00;EUR;
17.02.2014;16.01.2014;Company2;Debit;Text;-110,00;EUR;
16.02.2014;16.01.2014;Company1;Credit;Text;40,00;EUR
02.03.2014;02.03.2014;Company6;Debit;Text;90,00;EUR
期望输出
Credit Debit
Date1
2014-01; 600; -180
2014-02; 40; -110
2014-03; NaN; -90
这是我的密码
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import pylab
DATA = pd.read_csv('C:\Users\Desktop\File.txt'
CLEAN_VALUE=DATA['Value'].str.replace('.','').str.replace(',','.').astype(float)
DATA['CLEAN_VALUE']=CLEAN_VALUE
SUM=DATA['CLEAN_VALUE'].groupby(DATA['Reference']).sum()
DATA['Date1']=pd.to_datetime(DATA['Date1'],dayfirst=True,unit='D')
summe=DATA[:10].groupby(['Date1','Reference']).sum().unstack()
Sorted=pd.date_range(2013-01-01,2014-03-01,freq="M").resample('H', how=len)
事实上,直到我尝试按月分组的最后一步,它都工作得很好。我收到此错误:
Error message TypeError: Only valid with DatetimeIndex or PeriodIndex. Any suggestions? Thanks in advance.
到目前为止,只是读取数据和解析值,实际的
groupby
步骤非常短:这需要0.13.1(对于
infer_datetime_format
)。这比 直接使用日期分析器。这将把datelike转换为正确的datetime64[ns]
数据类型。这需要0.14/master,这将是使用基于时间和其他分组器进行多重分组的新的简单方法。
<;0.14/master您可以执行以下操作:
相关问题 更多 >
编程相关推荐