非常新的编码和python,所以请容忍我。我看了又看,但没有找到解决这个问题的办法
我有一个来自大型excel电子表格的数据框,其中“示踪气体类型”列(随机行)中有一个连续的“1”、“2”、“1”、“2”模式。。。新兴的这些行需要从电子表格的其余部分拆分。数据帧的一个示例部分:
df = {'col1': [1, 2, 3, 4, 5, 6, 7, 8, 9], 'col2': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I'],
'Tracer gas type': ['1', '2', '1', '1', '0', '1', '2', '1', '2' ]}
df = pd.DataFrame(data=df)
图案始终以1开始,可能重复未知次数,并以2结束。在本例中,如果正确拆分,新df应仅包含旧df的前2行和最后4行:
作为起点,我已经能够拆分值为“1”的数据帧,但无法拆分“1”、“2”、“1”、“2”。。。使用此方法的部分:
self.new_df = self.df[self.df['Tracer gas type'] == '1']
提前感谢您的帮助
我不知道是否有一种简单的方法可以直接使用pandas,但您可以通过基本python在数据帧的所有行上进行迭代,如下所示:
这可能不是最漂亮的方式,但它会产生你作为例子给出的期望结果
相关问题 更多 >
编程相关推荐