我有一个来自SAP的文件,在处理数据时它不是最漂亮的。因此,使用series.str.contains()
和布尔掩码,我设法缩小到如下所示的数据帧:
0 1
0 SUB 123
1 CAT SKU
2 CODE 1000123
3 CODE 1000234
4 SUB 456
5 CAT LIQ
6 CODE1 1000345
7 CODE1 1000534
8 CODE1 1000433
我正在寻找一种方法,可以将每个SUB
分隔成一个新条目,如下所示:
print(expected_df)
SUB CAT CODE CODE1
0 123 SKU 1000123.0 NaN
1 123 SKU 1000234.0 NaN
2 456 LIQ NaN 1000345.0
3 456 LIQ NaN 1000534.0
4 456 LIQ NaN 1000433.0
我好像过不了这一步。但是,这一行:
df[0].eq('SUB').cumsum()
有助于分隔组,如果需要,可以用作助手系列。你知道吗
如有任何帮助,如图所示,将不胜感激。你知道吗
谢谢。你知道吗
IIUC公司
您可以尝试对特定的“SUB”列组行使用
df.pivot
,后跟.ffill()、bfill()。你知道吗输出:
IIUC公司
输出
然而,这看起来像是一个XY问题。也许有必要先看看你是如何得到这个
df
的相关问题 更多 >
编程相关推荐