我现在拥有的.xls文件包含了不同地点在许多方面的多种污染物的一些参数。在
我创建了一个简化的数据帧,如下所示:
一些声明:
列站点包含监视站点属性。在这种情况下,S1,S2是这里仅有的两个位置。
时间列包含不同站点的监测周期。
物种A&B代表检测到两种化学污染物。
浓度是每个物种的一个关键参数(A&B)代表浓度。注意,物种A的浓度应该是平行测量的两倍。
p和Q是两个不同的分析实验。由于物种A有两个样本,分别以P1、P2、P3和Q1作为分析结果。物种B只能通过P进行分析。因此,P1,P2,P3是唯一的参数。
在阅读了一些关于使用熊猫操作pivot_表的帖子之后,我想试试。在
我在Excel中手动展示了我的目标文件构造,如下所示:
df = pd.ExcelFile("./test_file.xls")
df = df.parse("Sheet1")
pd.pivot_table(df,index = ["Site","Time","Species"])
结果是:
我想弄清楚的是在下面创建两个列p和Q和子列。在
我已经重新上传了我的测试文件here。任何有兴趣的人都可以下载。在
任何建议都将不胜感激!在
IIUC公司
您需要相同的数据帧,但具有更好的列索引。在
要创建第一个级别:
然后为columns属性指定一个多重索引。在
^{pr2}$看起来像:
相关问题 更多 >
编程相关推荐