更新我的问题让它更清楚。 我有一个CSV文件,它有多个列/行。 我是这样读的
in_csv = pd.read_csv(inputFileName.csv)
一般来说,列的格式是这样的
^{pr2}$某些行的值位于Def1
、Def_1x
、Def_1y
、Def2
、Def_2x
、Def_2y
。其他行只有Def1
、Def_1x
、Def_1y
中的值。
我想用另一个csv输出如下:
Col1,Col2,Col3,JK,KK,...,Def1,Def_1x,Def_1y
(否Def2
,Def_2x
,Def_2y
)row_i
在Def_2x
,Def_2y
中没有值,那么在输出csv中复制同一行(不带最后三个col)row_j
在Def_2x
,Def_2y
中有值,那么在输出csv中将其拆分为两行。一行带有Def1
,Def_1x
,Def_1y
,第二行的值在Def2
,Def_2x
,Def_2y
复制到输出csv的Def1
,Def_1x
,Def_1y
输入示例:
Col1,Col2,Col3,JK,KK,...,Def1, Def_1x,Def_1y,Def2,Def_2x,Def_2y
A1,B1,C1,....,a,0.2,0.3,,,
A2,B2,C2,.....,b,0.4,0.5,b,0.6,0.7
A3,B3,C3,.....,b,0.8,0.9,,,
A4,B4,C4,.....,,,,,,
预期产量:
Col1,Col2,Col3,JK,KK,...,Def1, Def_1x,Def_1y
A1,B1,C1,....,a,0.2,0.3
A2,B2,C2,.....,b,0.4,0.5
A2,B2,C2,.....,b,0.6,0.7
A3,B3,C3,.....,b,0.8,0.9
A4,B4,C4,.....,,,
行的顺序是相同的A1
,A2
,A2
,A3
,A4
。一旦一行被拆分,副本就在下面,而不是csv的底部。在
如果我可以像下面这样添加另一个专栏(RANK
),那将是一个非常感谢的奖励。对于非拆分行,它基本上总是1。一分为二的行,为1:2。在
Col1,Col2,Col3,JK,KK,...,RANK,Def1, Def_1x,Def_1y
A1,B1,C1,....,1,a,0.2,0.3
A2,B2,C2,.....,1,b,0.4,0.5
A2,B2,C2,.....,2,b,0.6,0.7
A3,B3,C3,.....,1,b,0.8,0.9
A4,B4,C4,.....,,,,
非常感谢。在
使用^{} 来堆叠}项。在
X
和{使用
df
作为Pandas数据帧:将
^{pr2}$X
和Y
项分开,然后concat()
:这里有一种方法
相关问题 更多 >
编程相关推荐